關(guān)于SQLServer中索引使用及維護(hù)簡介

字號:

在應(yīng)用系統(tǒng)中,尤其在聯(lián)機(jī)事務(wù)處理系統(tǒng)中,對數(shù)據(jù)查詢及處理速度已成為衡量應(yīng)用系統(tǒng)成敗的標(biāo)準(zhǔn)。而采用索引來加快數(shù)據(jù)處理速度也成為廣大數(shù)據(jù)庫用戶所接受的優(yōu)化方法。
    在良好的數(shù)據(jù)庫設(shè)計基礎(chǔ)上,能有效地使用索引是SQL Server取得高性能的基礎(chǔ),SQLServer采用基于代價的優(yōu)化模型,它對每一個提交的有關(guān)表的查詢,決定是否使用索引或用哪一個索引。因為查詢執(zhí)行的大部分開銷是磁盤I/O,使用索引提高性能的一個主要目標(biāo)是避免全表掃描,因為全表掃描需要從磁盤上讀表的每一個數(shù)據(jù)頁,如果有索引指向數(shù)據(jù)值,則查詢只需讀幾次磁盤就可以了。所以如果建立了合理的索引,優(yōu)化器就能利用索引加速數(shù)據(jù)的查詢過程。但是,索引并不總是提高系統(tǒng)的性能,在增、刪、改操作中索引的存在會增加一定的工作量,因此,在適當(dāng)?shù)牡胤皆黾舆m當(dāng)?shù)乃饕牟缓侠淼牡胤絼h除次優(yōu)的索引,將有助于優(yōu)化那些性能較差的SQLServer應(yīng)用。實踐表明,合理的索引設(shè)計是建立在對各種查詢的分析和預(yù)測上的,只有正確地使索引與程序結(jié)合起來,才能產(chǎn)生的優(yōu)化方案。本文就SQLServer索引的性能問題進(jìn)行了一些分析和實踐。
    一、聚簇索引(clustered indexes)的使用
    聚簇索引是一種對磁盤上實際數(shù)據(jù)重新組織以按指定的一個或多個列的值排序。由于聚簇索引的索引頁面指針指向數(shù)據(jù)頁面,所以使用聚簇索引查找數(shù)據(jù)幾乎總是比使用非聚簇索引快。每張表只能建一個聚簇索引,并且建聚簇索引需要至少相當(dāng)該表120%的附加空間,以存放該表的副本和索引中間頁。建立聚簇索引的思想是:
    1、大多數(shù)表都應(yīng)該有聚簇索引或使用分區(qū)來降低對表尾頁的競爭,在一個高事務(wù)的環(huán)境中,對最后一頁的封鎖嚴(yán)重影響系統(tǒng)的吞吐量。
    2、在聚簇索引下,數(shù)據(jù)在物理上按順序排在數(shù)據(jù)頁上,重復(fù)值也排在一起,因而在那些包含范圍檢查(between、<、<=、>、>=)或使用group by或order by的查詢時,一旦找到具有范圍中第一個鍵值的行,具有后續(xù)索引值的行保證物理上毗連在一起而不必進(jìn)一步搜索,避免了大范圍掃描,可以大大提高查詢速度。
    3、在一個頻繁發(fā)生插入操作的表上建立聚簇索引時,不要建在具有單調(diào)上升值的列(如IDENTITY)上,否則會經(jīng)常引起封鎖沖突。
    4、在聚簇索引中不要包含經(jīng)常修改的列,因為碼值修改后,數(shù)據(jù)行必須移動到新的位置。
    5、選擇聚簇索引應(yīng)基于where子句和連接操作的類型。
    聚簇索引的侯選列是:
    1、主鍵列,該列在where子句中使用并且插入是隨機(jī)的。
    2、按范圍存取的列,如pri_order > 100 and pri_order < 200。
    3、在group by或order by中使用的列。
    4、不經(jīng)常修改的列。
    5、在連接操作中使用的列。
    二、非聚簇索引(nonclustered indexes)的使用
    SQLServer缺省情況下建立的索引是非聚簇索引,由于非聚簇索引不重新組織表中的數(shù)據(jù),而是對每一行存儲索引列值并用一個指針指向數(shù)據(jù)所在的頁面。換句話說非聚簇索引具有在索引結(jié)構(gòu)和數(shù)據(jù)本身之間的一個額外級。一個表如果沒有聚簇索引時,可有250個非聚簇索引。每個非聚簇索引提供訪問數(shù)據(jù)的不同排序順序。在建立非聚簇索引時,要權(quán)衡索引對查詢速度的加快與降低修改速度之間的利弊。另外,還要考慮這些問題:
    1、索引需要使用多少空間。
    2、合適的列是否穩(wěn)定。
    3、索引鍵是如何選擇的,掃描效果是否更佳。
    4、是否有許多重復(fù)值。
    對更新頻繁的表來說,表上的非聚簇索引比聚簇索引和根本沒有索引需要更多的額外開銷。對移到新頁的每一行而言,指向該數(shù)據(jù)的每個非聚簇索引的頁級行也必須更新,有時可能還需要索引頁的分理。從一個頁面刪除數(shù)據(jù)的進(jìn)程也會有類似的開銷,另外,刪除進(jìn)程還必須把數(shù)據(jù)移到頁面上部,以保證數(shù)據(jù)的連續(xù)性。所以,建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情況:
    1、某列常用于集合函數(shù)(如Sum,....)。
    2、某列常用于join,order by,group by。
    3、查尋出的數(shù)據(jù)不超過表中數(shù)據(jù)量的20%。