朋友的一個checksum計算列建立的索引:
在數據庫設計中需要一列標注網頁的URL地址,LINK NVARCHAR(1000)。在INSERT的時候需要判斷之前有無同樣的URL地址記錄被插入。
也就是用select top 1 @ID=ID from Table where Link=@Link,然后判斷@ID值是否大于0。
如果數據量過大,需要給LINK加為索引,但是這時會發現SQL SERVER的索引對那么大的NVARCHR是無法建立的,限制在200字符以內。
我在最早的時候解決這個問題是采用了對LINK進行MD5化,MD5的值只有幾十個字符長,然后對MD5結果進行索引。但這樣做性能其實一般,而且大字段的數據庫索引同樣會占用不少存儲空間。
其實在SQL SERVER中可以設置計算字段,就是說該字段是可以是其他字段的計算結果。這樣的話就用CHECKSUM來優化上述的索引問題。
做法范例:
alter table tablename add csLink as CHECKSUM(Link)。
?
這樣就建立一個csLink列,生成的CHECKSUM值是一個大的整數。對該列進行索引,相當于對BITINT型進行索引,索引存儲空間也非常節約。這樣在判別有無重復LINK的時候就使用:
select top 1 @ID=ID from Table where csLink=CHECKSUM(@Link) And Link=@Link
?
數據庫會優先判斷csLink索引字段,而實際測試100萬條記錄的CHECKSUM,無一重復,所以第一次匹配的返回條數是極少的,基本可以做到一批匹配,而考慮肯能會有重復記錄,因此再加上And Link=@Link,這樣是在小的數據集中再次做無索引匹配,這樣性能損耗幾乎沒有感覺。
計算字段給我感覺就好像視圖,計算字段的靈活度除了簡化查找SELECT語句之外,對索引優化的作用是非常大的。CHECKSUM的用法只是發現之一,在今后一定會發現更多的有用的TIPS
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
