關(guān)于數(shù)據(jù)庫查詢性能調(diào)優(yōu)和索引優(yōu)化的總結(jié)
數(shù)據(jù)庫查詢性能調(diào)優(yōu)和索引優(yōu)化的知識是本文我們主要要介紹的內(nèi)容,了解了這方面的知識有助于提高SQL查詢的效率,接下來我們開始介紹這部分內(nèi)容。
查詢性能調(diào)優(yōu)是個很大的話題,這里邊涉及到的技術(shù)非常廣泛,但是我們一般可以把它大致分為以下幾個層次:
1.減少數(shù)據(jù)訪問。相關(guān)的技術(shù)就是建立合適的索引,將全表掃描、索引掃描(scan)等耗時的操作轉(zhuǎn)化為索引查找(seek)。建立正確的索引,能讓數(shù)據(jù)庫查詢性能提升100-1000倍甚至更高,就好比一本非常厚的詞典,如果沒有任何索引,你要查一個東西,那可是相當費盡,需要整本書查一遍,有索引就可以直接根據(jù)索引定位了。這是最重要的改善性能的途徑。
2.減少返回的數(shù)據(jù)。在網(wǎng)絡(luò)中傳輸數(shù)據(jù),帶寬是有限的,如果能按需提取最少量的數(shù)據(jù),會起到不錯的作用。這里需要注意的是,在SQL中,不要出現(xiàn)select *,而是需要什么字段,就提取什么字段。
3.減少與數(shù)據(jù)庫交互次數(shù)。網(wǎng)絡(luò)資源有限,顯然,頻繁與數(shù)據(jù)庫交互,也是制約性能的一個因素。一個良好的建議就是,使用存儲過程,或者批處理語句,這樣能減少與數(shù)據(jù)庫的交互,提升一部分性能。
4.減少CPU的負荷。這里,主要是使用緩存計劃。在查詢中,盡量使用參數(shù)化的查詢。這樣的話,數(shù)據(jù)庫會對查詢參數(shù)進行緩存,從而復用查詢計劃。
5.提升硬件性能。這是***一招了,如果其他方面都已經(jīng)做得非常不錯了,性能瓶頸在CPU,內(nèi)存和磁盤上,那采取提升硬件性能的方案就會顯得比較合適了,否則還是先去優(yōu)化其他的地方吧。
以上5個層次的優(yōu)化帶來的性能改善,是依次下降的,是一個倒置的金字塔。
下邊詳細討論一下索引的知識。
百度百科上對索引的描述是:“數(shù)據(jù)庫索引是對數(shù)據(jù)庫表中一列或多列的值進行排序的一種結(jié)構(gòu),使用索引可快速訪問數(shù)據(jù)庫表中的特定信息。”
索引,分為聚集索引(clustered index)和非聚集索引(nonclustered index)兩種。
a.聚集索引
含有聚集索引的表,叫做聚集表,它的數(shù)據(jù)行的組織方式,是跟聚集索引的順序是一致的。聚集索引覆蓋的列,叫做聚集鍵。
用新華字典來比喻的話,正文的每一個字就是一個數(shù)據(jù)行,他們的組織順序是根據(jù)拼音,如果拼音相同,就會根據(jù)筆畫(不一定準確,見諒),因此,新華字典里的聚集索引覆蓋的列就是拼音和筆畫。
很容易理解的是,正文只能按照一種既定的順序去排序,同理,在一張表里,只能有一個聚集索引,從而決定著數(shù)據(jù)行的組織方式。
b.非聚集索引
非聚集索引,用新華字典來比喻的話,就是字典正文之前的那些按拼音查找,按部首查找,按筆畫查找的附錄。它們描述了正文中的文字的排序位置,但是他們跟正文是分開的。非聚集索引,它跟數(shù)據(jù)的組織順序是毫無關(guān)系的,它用一系列指針來指向數(shù)據(jù)行,從而來描述數(shù)據(jù)行的位置。
不含有聚集索引的表,叫做堆表,它的數(shù)據(jù)行組織順序,是沒有特定順序的,類似于一堆書,增加一本書就放在這堆書的上面(在堆表中,具體實現(xiàn)方式可能不一樣)。
聚集索引對查詢性能影響非常大。聚集表中,非聚集索引是根據(jù)聚集鍵來定位的,而堆表中,非聚集索引是根據(jù)數(shù)據(jù)行號來定位的。這將有很大的性能區(qū)別,前者的性能大大優(yōu)于后者。所以,建立合適的聚集索引,是非常必要的。一個好的建議是,使用小字段的且值唯一的列來建立索引,而且***是單列,可以是代理鍵。因為如果字段太大太多,用來進行排序的開銷將會很大,得不償失;如果列值不唯一,數(shù)據(jù)庫會為該重復值附加4字節(jié)的信息來標識重復值,增加了不必要的開銷。
通常,我們在創(chuàng)建表的時候會指定主鍵,如果不顯式指定索引類型的話,將默認創(chuàng)建聚集索引。比如:add constraint pk_tbl primary key (sid),將創(chuàng)建以sid為序的聚集索引。可以顯式指定主鍵上的索引類型,比如,add constraint pk_tbl primary key nonclustered (sid),將創(chuàng)建一個非聚集索引的主鍵。所以,在創(chuàng)建主鍵的時候,一定得小心了,有多主鍵的情況,要注意顯式指定索引類型。
索引能大幅度提高查詢和排序性能,但是,在插入,刪除,以及修改了主鍵的操作中,是需要維護索引順序的。如果一張頻繁變更的表,是不宜建立過多的索引的,索引帶來的負面性能影響,將會得不償失。
索引優(yōu)化,是一個很考究的事情,它需要找到一個平衡點。
一般來說,有以下幾個建議來創(chuàng)建合適的索引:
1.超過300行的數(shù)據(jù)表要創(chuàng)建索引(無視掉)。
2.聚集索引字段不能過多,***是單字段,而且列值唯一。
3.對于數(shù)據(jù)字段特別多的表,而且這些字段有很多出現(xiàn)在where中,不宜在每一個字段上建立單獨的索引,而是創(chuàng)建組合索引。組合索引中,列的順序是很講究的,越是選擇性大而且唯一的列要放在前面,這對查詢優(yōu)化器優(yōu)化有很大的幫助。不宜在那些大量重復的列值上建立索引,比如在一個true,false的列上建索引,是毫無意義的。
4.如果查詢中,查詢的字段不多,可以考慮建立覆蓋索引,將字段都包含在索引里,可以僅僅訪問索引就能查詢到所有數(shù)據(jù),而不用表掃描。
關(guān)于數(shù)據(jù)庫查詢性能調(diào)優(yōu)和索引優(yōu)化的知識就介紹到這里了,希望本次的介紹能夠?qū)δ兴鶐椭?/p>
【編輯推薦】






