網上有很多 except 和 not in的返回結果區別這里就就提了。
主要講 except 和 not in 的性能上的區別。
CREATE TABLE tb1(ID int )
CREATE TABLE tb2(ID int )
BEGIN TRAN
DECLARE @i INT = 500
WHILE @i > 0
begin
INSERT INTO dbo.tb1
VALUES ( @i -- v - int
)
SET @i = @i - 1
end
COMMIT
我測試的時候tb1 是1000,tb2 是500
DBCC FREESYSTEMCACHE ( ' ALL ' , ' default ' );
SET STATISTICS IO ON
SET STATISTICS TIME on
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
SELECT * FROM tb1 WHERE id NOT IN ( SELECT id FROM tb2); -- 得不到任何值
SET STATISTICS IO OFF
SET STATISTICS TIME OFF
執行計劃:
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
| -- Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID]))
| -- Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC))
| | -- Table Scan(OBJECT:([master1].[dbo].[tb2]))
| -- Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC))
| -- Table Scan(OBJECT:([master1].[dbo].[tb1]))
SELECT * FROM tb1 WHERE id NOT IN ( SELECT id FROM tb2); -- 得不到任何值
| -- Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID]))
| -- Table Scan(OBJECT:([master1].[dbo].[tb2]))
| -- Nested Loops(Left Anti Semi Join)
| -- Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL))
| | -- Table Scan(OBJECT:([master1].[dbo].[tb1]))
| | -- Top(TOP EXPRESSION:((1)))
| | -- Table Scan(OBJECT:([master1].[dbo].[tb2]))
| -- Row Count Spool
| -- Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL))
SQL Server 執行時間:
CPU 時間 = 0 毫秒,占用時間 = 0 毫秒。
(500 行受影響)
表 'tb1'。掃描計數 1,邏輯讀取 2 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb2'。掃描計數 1,邏輯讀取 1 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
(6 行受影響)
(1 行受影響)
SQL Server 執行時間:
CPU 時間 = 0 毫秒,占用時間 = 528 毫秒。
(500 行受影響)
表 'Worktable'。掃描計數 0,邏輯讀取 0 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb2'。掃描計數 3,邏輯讀取 1002 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb1'。掃描計數 1,邏輯讀取 2 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
(10 行受影響)
(1 行受影響)
SQL Server 執行時間:
CPU 時間 = 16 毫秒,占用時間 = 498 毫秒。
SQL Server 執行時間:
CPU 時間 = 0 毫秒,占用時間 = 0 毫秒。
結論:通過較多數據 和 較少數據的測試,在較少數據的情況下 not in 比 except 性能好,但是在較多數據情況下 execpt 比 not in 出色。
? ? ? ? 看執行計劃可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的執行計劃開可以得到優化。
? ? ? ??
如果大家有興趣可以看看 not exists 的執行計劃。建議:
大家不要迷信測試結果,因為所有的性能都是和執行計劃密切相關的。而執行計劃和統計數據又密不可分。
所以過度的迷信測試結果,可能會對生產庫造成性能的影響達不到預期的性能效果。
?
?
?
?
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
