SQL Server 索引的底層實(shí)現(xiàn)概述
文章主要描述的是SQL Server 索引的底層實(shí)現(xiàn),本文的關(guān)鍵字為聚集索引 非聚集索引 clustered index,你的表(Tables)中數(shù)據(jù)實(shí)際上都存儲(chǔ)在頁(yè)(pages)之中的除了BLOB類(lèi)型的數(shù)據(jù)。如果某列的字段的類(lèi)型為BLOB那么將有一個(gè)16字節(jié)的指針指向BLOB page。
頁(yè)是MS SQL Server中數(shù)據(jù)存儲(chǔ)的最小單位。每頁(yè)包含以行(row)為單位保存數(shù)據(jù)。一行只能存儲(chǔ)在一個(gè)頁(yè)中。每頁(yè)可以容納8KB的信息。因?yàn)檫@個(gè)原因,每行的最大值為8KB。一組相鄰的8個(gè)頁(yè)被稱(chēng)為一個(gè)盤(pán)區(qū)(Extent)
堆文件和分配映射SQL Server 索引(Heap and the Index Allocation Map(IAM))
堆文件在sysindexs表中只有一行記錄,并且其indid = 0. sysindexs.FIRSTIAM字段指向了IAM頁(yè)鏈表中一個(gè)IAM頁(yè),IAM頁(yè)是用來(lái)管理SQL Server已經(jīng)給堆文件分配的空間。MS SQL Server2000用IAM(Index Allocation Map)頁(yè)來(lái)在堆文件中導(dǎo)航(navigate)。
在堆文件中,數(shù)據(jù)頁(yè)(data page)和數(shù)據(jù)頁(yè)中數(shù)據(jù)沒(méi)有按照特定的順序存儲(chǔ),也沒(méi)有鏈接在一起。數(shù)據(jù)頁(yè)之間唯一的邏輯鏈接是通過(guò)IAM頁(yè)中記錄來(lái)實(shí)現(xiàn)的。
SQL Server 索引索引結(jié)構(gòu)(Index Structure)
所有的SQL Server 索引都是 B-Trees。在這種樹(shù)的頂端有一個(gè)根頁(yè)(root page),通過(guò)root page來(lái)訪問(wèn)N個(gè)中級(jí)(intermediate level)頁(yè),直到樹(shù)的底部、或葉級(jí)(leaf level)。可以通過(guò)樹(shù)中每個(gè)節(jié)點(diǎn)的指針從上向下掃描整個(gè)索引樹(shù)。
另外,每個(gè)索引級(jí)(index leves)(可能是intermediate leve or leaf level)都有一個(gè)頁(yè)鏈(page chain)。在一個(gè)索引中有許多intermediate level。索引樹(shù)的級(jí)數(shù)(樹(shù)的高度)與索引碼的寬度、索引類(lèi)型、記錄行數(shù)和表中的頁(yè)數(shù)有關(guān),并且索引樹(shù)的級(jí)數(shù)是影響索引性能的一個(gè)重要參數(shù)。
非聚集索引(Nonclustered Indexs)
一個(gè)非聚集索引與一本書(shū)的索引相似。數(shù)據(jù)存儲(chǔ)在一個(gè)地方,SQL Server 索引索引存儲(chǔ)在另外一個(gè)地方,可以通過(guò)索引中的指針來(lái)訪問(wèn)存儲(chǔ)的數(shù)據(jù)。索引中的條目是按照索引碼的值按序存儲(chǔ),但是表中的信息可以按照不同的順序存儲(chǔ)(如可以按照聚集索引存儲(chǔ))。如果表中沒(méi)有創(chuàng)建聚集索引,那么表中的記錄就不能保證按照某種特定的順序。
與你用一本書(shū)的索引方式一樣,SQL Server2000也是先通過(guò)非聚集索引檢索到查找數(shù)據(jù)在表的位置,然后通過(guò)該位置來(lái)檢索數(shù)據(jù)。這使得非聚集索引非常適合精確匹配查詢(xún)(This makes nonclustered indexes the optimal choice for exact match queries),因?yàn)樗饕龡l目中包含了你需要查找數(shù)據(jù)的位置信息。
如果當(dāng)前的表是以聚集索引方式存儲(chǔ),那么非聚集SQL Server 索引的位置信息就是聚集索引的索引碼(index key);否則,位置信息就是row ID(RID),每個(gè)RID由file number、page number和 slot number of row(每行記錄的槽號(hào))。
比如,要在一個(gè)表中檢索某個(gè)employee ID(emp_id),該表已經(jīng)有在emp_id列上創(chuàng)建了非聚集索引,SQL Server查找索引樹(shù),找到一個(gè)索引條目包含你需要查找的emp_id,然后利用其中RID來(lái)訪問(wèn)到對(duì)應(yīng)數(shù)據(jù)頁(yè)中的值。
【編輯推薦】