實際搜索通過程序模型分析文檔,而是試圖切出和人的思維習慣相近的結果是非常的艱難的,清華大學在日本的交流“自然語言和計算機語言的轉換課題”中說到,目前的索引程序尤其大型的搜索引擎只有56%的準確率。-
-
所以搜索在大力開發歧義字段自動識別技術,以此拉近和人思維和閱覽習慣的距離。-
-
切詞的歧義:-
-
交集性歧義篇:-
-
“乒乓球拍賣完了”-
-
出現兩種切分結果>>>-
-
乒乓球拍/賣/完了-
-
乒乓球/拍賣/完了-
-
這是兩種不同的結果,同時直接影響到該句的主題關鍵詞的提取。所以最好的辦法只有在語句中,再次的找尋答案。-
-
(例子來自:搜索引擎技術 趙杰著)-
-
組合型的歧義類型:-
-
例如早期不是吵得沸沸揚揚的“和服”-
-
“某某長生產的長袖衫和服飾非常的暢銷”-
-
其中的和服將被歧義。-
-
這是本質的歧義,中文索引中此類的情況很多。-
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
