Mysql中用exists代替in;exists對(duì)外表用loop逐條查詢,每次查詢都會(huì)查看exists的條件語(yǔ)句,當(dāng)exists里的條件語(yǔ)句能夠返回記錄行時(shí),條件就為真,返回當(dāng)前l(fā)oop到的這條記錄。
exists對(duì)外表用loop逐條查詢,每次查詢都會(huì)查看exists的條件語(yǔ)句,當(dāng) exists里的條件語(yǔ)句能夠返回記錄行時(shí)(無(wú)論記錄行是的多少,只要能返回),條件就為真,返回當(dāng)前l(fā)oop到的這條記錄,反之如果exists里的條 件語(yǔ)句不能返回記錄行,則當(dāng)前l(fā)oop到的這條記錄被丟棄,exists的條件就像一個(gè)bool條件,當(dāng)能返回結(jié)果集則為true,不能返回結(jié)果集則為 false
如下:
select * from user where exists (select 1);
對(duì)user表的記錄逐條取出,由于子條件中的select 1永遠(yuǎn)能返回記錄行,那么user表的所有記錄都將被加入結(jié)果集,所以與 select * from user;是一樣的
又如下
select * from user where exists (select * from user where userId = 0);
可以知道對(duì)user表進(jìn)行l(wèi)oop時(shí),檢查條件語(yǔ)句(select * from user where userId = 0),由于userId永遠(yuǎn)不為0,所以條件語(yǔ)句永遠(yuǎn)返回空集,條件永遠(yuǎn)為false,那么user表的所有記錄都將被丟棄
not exists與exists相反,也就是當(dāng)exists條件有結(jié)果集返回時(shí),loop到的記錄將被丟棄,否則將loop到的記錄加入結(jié)果集
總的來(lái)說(shuō),如果A表有n條記錄,那么exists查詢就是將這n條記錄逐條取出,然后判斷n遍exists條件
in查詢相當(dāng)于多個(gè)or條件的疊加,這個(gè)比較好理解,比如下面的查詢
select * from user where userId in (1, 2, 3);
等效于
select * from user where userId = 1 or userId = 2 or userId = 3;
not in與in相反,如下
select * from user where userId not in (1, 2, 3);
等效于
select * from user where userId != 1 and userId != 2 and userId != 3;
總的來(lái)說(shuō),in查詢就是先將子查詢條件的記錄全都查出來(lái),假設(shè)結(jié)果集為B,共有m條記錄,然后在將子查詢條件的結(jié)果集分解成m個(gè),再進(jìn)行m次查詢
值得一提的是,in查詢的子條件返回結(jié)果必須只有一個(gè)字段,例如
select * from user where userId in (select id from B);
而不能是
select * from user where userId in (select id, age from B);
而exists就沒(méi)有這個(gè)限制
下面來(lái)考慮exists和in的性能
考慮如下SQL語(yǔ)句
1: select * from A where exists (select * from B where B.id = A.id);
2: select * from A where A.id in (select id from B);
查詢1.可以轉(zhuǎn)化以下偽代碼,便于理解
for ($i = 0; $i < count(A); $i++) { $a = get_record(A, $i); #從A表逐條獲取記錄 if (B.id = $a[id]) #如果子條件成立 $result[] = $a; } return $result;
大概就是這么個(gè)意思,其實(shí)可以看到,查詢1主要是用到了B表的索引,A表如何對(duì)查詢的效率影響應(yīng)該不大
假設(shè)B表的所有id為1,2,3,查詢2可以轉(zhuǎn)換為
select * from A where A.id = 1 or A.id = 2 or A.id = 3;
這個(gè)好理解了,這里主要是用到了A的索引,B表如何對(duì)查詢影響不大
下面再看not exists 和 not in
1. select * from A where not exists (select * from B where B.id = A.id);
2. select * from A where A.id not in (select id from B);
看查詢1,還是和上面一樣,用了B的索引
而對(duì)于查詢2,可以轉(zhuǎn)化成如下語(yǔ)句
select * from A where A.id != 1 and A.id != 2 and A.id != 3;
可以知道not in是個(gè)范圍查詢,這種!=的范圍查詢無(wú)法使用任何索引,等于說(shuō)A表的每條記錄,都要在B表里遍歷一次,查看B表里是否存在這條記錄
故not exists比not in效率高
mysql中的in語(yǔ)句是把外表和內(nèi)表作hash 連接,而exists語(yǔ)句是對(duì)外表作loop循環(huán),每次loop循環(huán)再對(duì)內(nèi)表進(jìn)行查詢。一直大家都認(rèn)為exists比in語(yǔ)句的效率要高,這種說(shuō)法其實(shí)是不準(zhǔn)確的。這個(gè)是要區(qū)分環(huán)境的。
如果查詢的兩個(gè)表大小相當(dāng),那么用in和exists差別不大。
如果兩個(gè)表中一個(gè)較小,一個(gè)是大表,則子查詢表大的用exists,子查詢表小的用in:
例如:表A(小表),表B(大表)
1:
select * from A where cc in (select cc from B) 效率低,用到了A表上cc列的索引;
select * from A where exists(select cc from B where cc=A.cc) 效率高,用到了B表上cc列的索引。
相反的
2:
select * from B where cc in (select cc from A) 效率高,用到了B表上cc列的索引;
select * from B where exists(select cc from A where cc=B.cc) 效率低,用到了A表上cc列的索引。
not in 和not exists如果查詢語(yǔ)句使用了not in 那么內(nèi)外表都進(jìn)行全表掃描,沒(méi)有用到索引;而not extsts 的子查詢依然能用到表上的索引。所以無(wú)論那個(gè)表大,用not exists都比not in要快。
in 與 =的區(qū)別
select name from student where name in ('zhang','wang','li','zhao');
與
select name from student where name='zhang' or name='li' or name='wang' or name='zhao'
的結(jié)果是相同的。
推薦教程:mysql視頻教程