SQL進(jìn)行排序、分組、統(tǒng)計(jì)的10個(gè)新技巧

字號:

以一種有意義的方式組織數(shù)據(jù)可能是一項(xiàng)挑戰(zhàn)。有時(shí)你需要的可能是一個(gè)簡單的排序,但是通常你需要做更多,你需要分組來進(jìn)行分析和統(tǒng)計(jì)。幸運(yùn)的是,SQL提供了大量語句和操作來進(jìn)行排序,分組和摘要。下面的一些技巧將會(huì)幫助你識別什么時(shí)候排序,什么時(shí)候分組,什么時(shí)候以及如何統(tǒng)計(jì)。對要每條語句和操作的詳細(xì)信息請查看Books Online。
    1.使用排序使數(shù)據(jù)有序
    通常,你的所有數(shù)據(jù)真正需要的僅僅是按某種順序排列。SQL的ORDER BY語句可以以字母或數(shù)字順序組織數(shù)據(jù)。因此,相似的值按組排序在一起。然而,這個(gè)分組時(shí)排序的結(jié)果,并不是真的分組。ORDER BY顯示每條記錄而分組可能代表很多記錄。
    2.進(jìn)行分組除去重復(fù)值
    排序和分組之間的區(qū)別是:排序的數(shù)據(jù)顯示所有記錄(在限定標(biāo)準(zhǔn)范圍之內(nèi)),而分組數(shù)據(jù)不是顯示所有記錄。GROUP BY語句對于同樣的值只顯示一條記錄。例如,下面的語句中的GROUP BY語句對數(shù)據(jù)源中重復(fù)出現(xiàn)的數(shù)據(jù)只返回的zip編碼列。
    SELECT ZIP FROM Customers GROUP BY ZIP
    只包括由GROUP BY和SELECT語句共同定義的那些記錄,換句話說,SELECT列表必須滿足GROUP BY列表,但是有一個(gè)例外就是SELECT列表可以包含聚合函數(shù)(GROUP BY語句不允許使用聚合函數(shù))。需要注意的是GROUP BY語句不會(huì)對結(jié)果分組進(jìn)行排序。為了使分組按字母或數(shù)字有序排列,需要添加ORDER BY語句。此外,在GROUP BY語句中不能引用使用了別名的字段。分組欄目必須是潛在的數(shù)據(jù),但它們并不需要顯示在結(jié)果中。
    3.在分組之前進(jìn)行數(shù)據(jù)篩選
    你可以添加一個(gè)WHERE語句來篩選有GROUP BY所得分組中的數(shù)據(jù)。例如,下面的語句只返回肯塔基州顧客的ZIP編碼列。
    SELECT ZIP FROM CustomersWHEREState = ’KY’ GROUP BY ZIP
    必須注意的是WHERE語句是在GROUP BY語句求值之前進(jìn)行數(shù)據(jù)過濾的。與GROUP BY語句一樣,WHERE語句也不支持聚合函數(shù)。
    4.返回所有分組
    當(dāng)你使用WHERE語句過濾數(shù)據(jù)時(shí),結(jié)果分組中只顯示你指定的那些記錄,而符合分組定義但是不滿足過濾條件的數(shù)據(jù)不會(huì)包含在某個(gè)分組中。當(dāng)你想在分組中包含所有數(shù)據(jù)時(shí)添加關(guān)鍵字ALL即可,這時(shí)WHERE條件就不起作用。例如,在前面的例子中添加關(guān)鍵字ALL就會(huì)返回所有的ZIP分組,而不是僅在肯塔基州的那些。
    SELECT ZIP FROM CustomersWHEREState = ’KY’ GROUP BY ALL ZIP
    這樣看來,這兩個(gè)語句存在沖突,你可能不會(huì)以這種方式使用關(guān)鍵字ALL。當(dāng)你使用聚合函數(shù)計(jì)算某一列時(shí),使用ALL關(guān)鍵字可能會(huì)很方便。例如,下面的語句計(jì)算每個(gè)肯塔基州ZIP中的顧客數(shù),同時(shí),還會(huì)顯示其它的ZIP值。
    SELECT ZIP, Count(ZIP) AS KYCustomersByZIP FROM
    CustomersWHEREState = ’KY’ GROUP BY ALL ZIP
    結(jié)果分組包括潛在數(shù)據(jù)中的所有ZIP值,然而,對于那些不是肯塔基州ZIP分組的聚合列(KYCustomersByZIP)將會(huì)顯示0。遠(yuǎn)程查詢不支持 GROUP BY ALL。
    5.分組后篩選數(shù)據(jù)
    WHERE語句在GROUP BY語句之前進(jìn)行計(jì)算。當(dāng)你需要在分組之后篩選數(shù)據(jù)時(shí),可以使用HAVING語句。通常情況下,WHERE語句和HAVING語句的返回結(jié)果是一樣的,但是值得注意的是這兩個(gè)語句不可互換。當(dāng)你迷惑時(shí),可以遵循下面的說明:使用WHERE語句過濾記錄,使用HAVING語句過濾分組。
    一般情況,你會(huì)使用HAVING語句和某個(gè)聚合函數(shù)計(jì)算一個(gè)分組。例如,下面的語句返回一個(gè)的ZIP編碼列,但是可能不會(huì)包含潛在數(shù)據(jù)源中所有的ZIP。
    SELECT ZIP, Count(ZIP) AS CustomersByZIP FROM
    Customers GROUP BY ZIP HAVING Count(ZIP) = 1
    只有那些包含一位顧客的分組顯示在結(jié)果中。
    6.進(jìn)一步了解WHERE和HAVING語句
    如果你對何時(shí)應(yīng)該使用WHERE,何時(shí)使用HAVING仍舊很迷惑,請遵照下面的說明:
    WHERE語句在GROUP BY語句之前;SQL會(huì)在分組之前計(jì)算WHERE語句。
    HAVING語句在GROUP BY語句之后;SQL會(huì)在分組之后計(jì)算HAVING語句。
    7.使用聚合函數(shù)統(tǒng)計(jì)分組數(shù)據(jù)
    分組數(shù)據(jù)可以幫助我們分析數(shù)據(jù),但是有時(shí)我們可能需要更多的信息而不僅僅是分組。你可以使用聚合函數(shù)來統(tǒng)計(jì)分組數(shù)據(jù)。例如,下面的語句顯示每批訂購單的總價(jià)錢。
    SELECT OrderID, Sum(Cost * Quantity) AS OrderTotal  FROM Orders GROUP BY OrderID
    對于其它的分組來說,SELECT和GROUP?。拢倭斜仨毱ヅ洹6鳶ELECT語句包含聚合函數(shù)時(shí)這一規(guī)則是一個(gè)例外。
    8.統(tǒng)計(jì)聚合數(shù)據(jù)
    你可以繼續(xù)統(tǒng)計(jì)數(shù)據(jù)為每個(gè)分組顯示一個(gè)分類統(tǒng)計(jì)。SQL的ROLLUP操作符可以為每個(gè)分組顯示一個(gè)額外的分類統(tǒng)計(jì)。這個(gè)分類統(tǒng)計(jì)是使用聚合函數(shù)計(jì)算每個(gè)分組中的所有記錄得到的結(jié)果。下面的語句為每個(gè)分組計(jì)算OrderTotal:
    SELECT Customer, OrderNumber, Sum(Cost * Quantity)  AS OrderTotal FROM Orders GROUP BY Customer, OrderNumber WITH ROLLUP
    對于有兩個(gè)分別為20和25 OderTotal值的分組,ROLLUP顯示一個(gè)OrderTotal值45。ROLLUP結(jié)果中的第一條記錄是的,因?yàn)樗怯?jì)算所有分組記錄,這個(gè)值是整個(gè)記錄集的總值。
    ROLLUP在聚合函數(shù)中不支持 DISTINCT,也不支持GROUP BY ALL語句。
    9.統(tǒng)計(jì)每個(gè)列
    CUBE操作符比ROLLUP更進(jìn)一步,它返回每個(gè)分組中重復(fù)值的個(gè)數(shù)。它的結(jié)果和ROLLUP相同,但是對每位客戶的每一列CUBE包含一個(gè)額外的記錄。下面的語句顯示每個(gè)分組的統(tǒng)計(jì)和額外每位客戶的統(tǒng)計(jì)。
    SELECT Customer, OrderNumber, Sum(Cost * Quantity)  AS OrderTotal FROM Orders GROUP BY Customer,
    OrderNumber WITH CUBE
    CUBE可以給最綜合的統(tǒng)計(jì)。它不僅完成聚合和ROLLUP的功能,還可以計(jì)算定義分組的其它列,換句話說,CUBE統(tǒng)計(jì)每個(gè)可能的列組合。
    CUBE不支持GROUP BY ALL語句。
    10:對統(tǒng)計(jì)結(jié)果排序
    當(dāng)CUBE的結(jié)果令人迷惑時(shí)(它經(jīng)常是這樣),可以添加一個(gè)GROUPING函數(shù),如下所示:
    SELECT GROUPING(Customer), OrderNumber, Sum(Cost * Quantity) AS OrderTotal FROM Orders GROUP
    BY Customer, OrderNumber WITH CUBE
    結(jié)果中每行包含兩個(gè)額外的值:
    值1表示左邊的值是一個(gè)統(tǒng)計(jì)值,是ROLLUP或CUBE的操作符。
    值0表示左邊的值是一條由最初的GROUP BY語句產(chǎn)生的詳細(xì)記錄。