實(shí)際搜索通過程序模型分析文檔,而是試圖切出和人的思維習(xí)慣相近的結(jié)果是非常的艱難的,清華大學(xué)在日本的交流“自然語言和計算機(jī)語言的轉(zhuǎn)換課題”中說到,目前的索引程序尤其大型的搜索引擎只有56%的準(zhǔn)確率。-
-
所以搜索在大力開發(fā)歧義字段自動識別技術(shù),以此拉近和人思維和閱覽習(xí)慣的距離。-
-
切詞的歧義:-
-
交集性歧義篇:-
-
“乒乓球拍賣完了”-
-
出現(xiàn)兩種切分結(jié)果>>>-
-
乒乓球拍/賣/完了-
-
乒乓球/拍賣/完了-
-
這是兩種不同的結(jié)果,同時直接影響到該句的主題關(guān)鍵詞的提取。所以最好的辦法只有在語句中,再次的找尋答案。-
-
(例子來自:搜索引擎技術(shù) 趙杰著)-
-
組合型的歧義類型:-
-
例如早期不是吵得沸沸揚(yáng)揚(yáng)的“和服”-
-
“某某長生產(chǎn)的長袖衫和服飾非常的暢銷”-
-
其中的和服將被歧義。-
-
這是本質(zhì)的歧義,中文索引中此類的情況很多。-
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061
微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元

