關(guān)于SQLServer中索引使用及維護(hù)簡(jiǎn)介

字號(hào)：小 中 大

在應(yīng)用系統(tǒng)中,尤其在聯(lián)機(jī)事務(wù)處理系統(tǒng)中,對(duì)數(shù)據(jù)查詢及處理速度已成為衡量應(yīng)用系統(tǒng)成敗的標(biāo)準(zhǔn)。而采用索引來(lái)加快數(shù)據(jù)處理速度也成為廣大數(shù)據(jù)庫(kù)用戶所接受的優(yōu)化方法。
    在良好的數(shù)據(jù)庫(kù)設(shè)計(jì)基礎(chǔ)上，能有效地使用索引是SQL Server取得高性能的基礎(chǔ)，SQLServer采用基于代價(jià)的優(yōu)化模型，它對(duì)每一個(gè)提交的有關(guān)表的查詢，決定是否使用索引或用哪一個(gè)索引。因?yàn)椴樵儓?zhí)行的大部分開銷是磁盤I/O，使用索引提高性能的一個(gè)主要目標(biāo)是避免全表掃描，因?yàn)槿頀呙栊枰獜拇疟P上讀表的每一個(gè)數(shù)據(jù)頁(yè)，如果有索引指向數(shù)據(jù)值，則查詢只需讀幾次磁盤就可以了。所以如果建立了合理的索引，優(yōu)化器就能利用索引加速數(shù)據(jù)的查詢過(guò)程。但是，索引并不總是提高系統(tǒng)的性能，在增、刪、改操作中索引的存在會(huì)增加一定的工作量，因此，在適當(dāng)?shù)牡胤皆黾舆m當(dāng)?shù)乃饕牟缓侠淼牡胤絼h除次優(yōu)的索引，將有助于優(yōu)化那些性能較差的SQLServer應(yīng)用。實(shí)踐表明，合理的索引設(shè)計(jì)是建立在對(duì)各種查詢的分析和預(yù)測(cè)上的，只有正確地使索引與程序結(jié)合起來(lái),才能產(chǎn)生的優(yōu)化方案。本文就SQLServer索引的性能問(wèn)題進(jìn)行了一些分析和實(shí)踐。
    一、聚簇索引(clustered indexes)的使用
    聚簇索引是一種對(duì)磁盤上實(shí)際數(shù)據(jù)重新組織以按指定的一個(gè)或多個(gè)列的值排序。由于聚簇索引的索引頁(yè)面指針指向數(shù)據(jù)頁(yè)面，所以使用聚簇索引查找數(shù)據(jù)幾乎總是比使用非聚簇索引快。每張表只能建一個(gè)聚簇索引，并且建聚簇索引需要至少相當(dāng)該表120%的附加空間，以存放該表的副本和索引中間頁(yè)。建立聚簇索引的思想是：
    1、大多數(shù)表都應(yīng)該有聚簇索引或使用分區(qū)來(lái)降低對(duì)表尾頁(yè)的競(jìng)爭(zhēng)，在一個(gè)高事務(wù)的環(huán)境中，對(duì)最后一頁(yè)的封鎖嚴(yán)重影響系統(tǒng)的吞吐量。
    2、在聚簇索引下，數(shù)據(jù)在物理上按順序排在數(shù)據(jù)頁(yè)上，重復(fù)值也排在一起，因而在那些包含范圍檢查(between、<、<=、>、>=)或使用group by或order by的查詢時(shí)，一旦找到具有范圍中第一個(gè)鍵值的行，具有后續(xù)索引值的行保證物理上毗連在一起而不必進(jìn)一步搜索，避免了大范圍掃描，可以大大提高查詢速度。
    3、在一個(gè)頻繁發(fā)生插入操作的表上建立聚簇索引時(shí)，不要建在具有單調(diào)上升值的列(如IDENTITY)上，否則會(huì)經(jīng)常引起封鎖沖突。
    4、在聚簇索引中不要包含經(jīng)常修改的列，因?yàn)榇a值修改后，數(shù)據(jù)行必須移動(dòng)到新的位置。
    5、選擇聚簇索引應(yīng)基于where子句和連接操作的類型。
    聚簇索引的侯選列是：
    1、主鍵列,該列在where子句中使用并且插入是隨機(jī)的。
    2、按范圍存取的列，如pri_order > 100 and pri_order < 200。
    3、在group by或order by中使用的列。
    4、不經(jīng)常修改的列。
    5、在連接操作中使用的列。
    二、非聚簇索引(nonclustered indexes)的使用
    SQLServer缺省情況下建立的索引是非聚簇索引，由于非聚簇索引不重新組織表中的數(shù)據(jù)，而是對(duì)每一行存儲(chǔ)索引列值并用一個(gè)指針指向數(shù)據(jù)所在的頁(yè)面。換句話說(shuō)非聚簇索引具有在索引結(jié)構(gòu)和數(shù)據(jù)本身之間的一個(gè)額外級(jí)。一個(gè)表如果沒(méi)有聚簇索引時(shí),可有250個(gè)非聚簇索引。每個(gè)非聚簇索引提供訪問(wèn)數(shù)據(jù)的不同排序順序。在建立非聚簇索引時(shí)，要權(quán)衡索引對(duì)查詢速度的加快與降低修改速度之間的利弊。另外，還要考慮這些問(wèn)題：
    1、索引需要使用多少空間。
    2、合適的列是否穩(wěn)定。
    3、索引鍵是如何選擇的，掃描效果是否更佳。
    4、是否有許多重復(fù)值。
    對(duì)更新頻繁的表來(lái)說(shuō)，表上的非聚簇索引比聚簇索引和根本沒(méi)有索引需要更多的額外開銷。對(duì)移到新頁(yè)的每一行而言，指向該數(shù)據(jù)的每個(gè)非聚簇索引的頁(yè)級(jí)行也必須更新，有時(shí)可能還需要索引頁(yè)的分理。從一個(gè)頁(yè)面刪除數(shù)據(jù)的進(jìn)程也會(huì)有類似的開銷，另外，刪除進(jìn)程還必須把數(shù)據(jù)移到頁(yè)面上部，以保證數(shù)據(jù)的連續(xù)性。所以，建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情況:
    1、某列常用于集合函數(shù)(如Sum,....)。
    2、某列常用于join,order by,group by。
    3、查尋出的數(shù)據(jù)不超過(guò)表中數(shù)據(jù)量的20%。

關(guān)于SQLServer中索引使用及維護(hù)簡(jiǎn)介

字號(hào)： 小 中 大

字號(hào)：小中大