初步介紹MySQL中的集合操作

字號(hào):


    啥是集合操作?
    通常來(lái)說(shuō),將聯(lián)接操作看作是表之間的水平操作,因?yàn)樵摬僮魃傻奶摂M表包含兩個(gè)表中的列。而我這里總結(jié)的集合操作,一般將這些操作看作是垂直操作。MySQL數(shù)據(jù)庫(kù)支持兩種集合操作:UNION DISTINCT和UNION ALL。
    與聯(lián)接操作一樣,集合操作也是對(duì)兩個(gè)輸入進(jìn)行操作,并生成一個(gè)虛擬表。在聯(lián)接操作中,一般把輸入表稱為左輸入和右輸入。集合操作的兩個(gè)輸入必須擁有相同的列數(shù),若數(shù)據(jù)類型不同,MySQL數(shù)據(jù)庫(kù)自動(dòng)將進(jìn)行隱式轉(zhuǎn)換。同時(shí),結(jié)果列的名稱由左輸入決定。
    前期準(zhǔn)備
    準(zhǔn)備測(cè)試表table1和table2:
    create table table1 (aid int not null auto_increment, title varchar(20), tag varchar(10), primary key(aid)) engine=innodb default charset=utf8; create table table2 (bid int not null auto_increment, title varchar(20), tag varchar(10), primary key(bid)) engine=innodb default charset=utf8;
    插入以下測(cè)試數(shù)據(jù):
    insert into table1(aid, title, tag) values(1, 'article1', 'MySQL'); insert into table1(aid, title, tag) values(2, 'article2', 'PHP'); insert into table1(aid, title, tag) values(3, 'article3', 'CPP'); insert into table2(bid, title, tag) values(1, 'article1', 'MySQL'); insert into table2(bid, title, tag) values(2, 'article2', 'CPP'); insert into table2(bid, title, tag) values(3, 'article3', 'C');
    UNION DISTINCT
    UNION DISTINCT組合兩個(gè)輸入,并應(yīng)用DISTINCT過(guò)濾重復(fù)項(xiàng),一般可以直接省略DISTINCT關(guān)鍵字,直接使用UNION。
    UNION的語(yǔ)法如下:
    SELECT column,... FROM table1 UNION [ALL] SELECT column,... FROM table2 ...
    在多個(gè)SELECT語(yǔ)句中,對(duì)應(yīng)的列應(yīng)該具有相同的字段屬性,且第一個(gè)SELECT語(yǔ)句中被使用的字段名稱也被用于結(jié)果的字段名稱。
    現(xiàn)在我運(yùn)行以下sql語(yǔ)句:
    (select * from table1) union (select * from table2);
    將會(huì)得到以下結(jié)果:
    +-----+----------+-------+ | aid | title | tag | +-----+----------+-------+ | 1 | article1 | MySQL | | 2 | article2 | PHP | | 3 | article3 | CPP | | 2 | article2 | CPP | | 3 | article3 | C | +-----+----------+-------+
    我們發(fā)現(xiàn),表table1和表table2中的重復(fù)數(shù)據(jù)項(xiàng):
    | 1 | article1 | MySQL |
    只出現(xiàn)了一次,這就是UNION的作用效果。
    MySQL數(shù)據(jù)庫(kù)目前對(duì)UNION DISTINCT的實(shí)現(xiàn)方式如下:
    創(chuàng)建一張臨時(shí)表,也就是虛擬表;
    對(duì)這張臨時(shí)表的列添加唯一索引;
    將輸入的數(shù)據(jù)插入臨時(shí)表;
    返回虛擬表。
    因?yàn)樘砑恿宋ㄒ凰饕钥梢赃^(guò)濾掉集合中重復(fù)的數(shù)據(jù)項(xiàng)。這里重復(fù)的意思是SELECT所選的字段完全相同時(shí),才會(huì)算作是重復(fù)的。
    UNION ALL
    UNION ALL的意思是不會(huì)排除掉重復(fù)的數(shù)據(jù)項(xiàng),比如我運(yùn)行以下的sql語(yǔ)句:
    (select * from table1) union all (select * from table2);
    你將會(huì)得到以下結(jié)果:
    +-----+----------+-------+ | aid | title | tag | +-----+----------+-------+ | 1 | article1 | MySQL | | 2 | article2 | PHP | | 3 | article3 | CPP | | 1 | article1 | MySQL | | 2 | article2 | CPP | | 3 | article3 | C | +-----+----------+-------+
    發(fā)現(xiàn)重復(fù)的數(shù)據(jù)并不會(huì)被篩選掉。
    在使用UNION DISTINCT的時(shí)候,由于向臨時(shí)表中添加了唯一索引,插入的速度顯然會(huì)因此而受到影響。如果確認(rèn)進(jìn)行UNION操作的兩個(gè)集合中沒(méi)有重復(fù)的選項(xiàng),最有效的辦法應(yīng)該是使用UNION ALL。