欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

協同推薦系統簡介

系統 1678 0
協同推薦系統簡介


最近幾年搜索引擎理念可謂滲入人心,對于互聯網產品設計人員來說,張口必言搜索。同事基于搜索技術的各種產品也在Web2.0的浪潮下如雨后春筍,刷刷往 外冒。在這些林林總總的產品里面,幾乎都能見到“ tag , 相關新聞, 相似產品 ” 類推薦鏈接的蹤影。稍加留意這些產品的實現就可以發現,大多還是基于關鍵詞的搜索機制實現的。很顯然基于關鍵詞技術的相關推薦是最直觀的,似乎也是最有效 的一種實現方式,如同機槍中的AK-47,那他沖鋒陷陣總是屢試不爽。

對于文字類產品的推薦,基于關鍵詞的實現方式,目前還是主流;但在電子商務,智能閱讀推薦,商務搜索方面單純的關鍵字相關性實現機制還不那么讓人滿意,這也就有了協同推薦過濾系統。 Collaborative filtering

所謂協同推薦,很顯然彌補了單純依賴關鍵詞相關性的不足,把獲取相關性數據的視角放大到數據從產生到消費的各個環節。

有2種最基礎類型的協同推薦系統:

1 基于當前活躍用戶 和 上一個用戶的相似性 來進行分析(一般是計算用戶購買或者感興趣的商品來進行);側重于用戶
2 基于當前用戶選擇(或感興趣)的商品 和 上一個用戶感興趣的商品的相似性來進行分析;

這也就是大家所熟知的 user-based 和item-based協同推薦。

根據實現機制物理載體劃分,以上兩類協同推薦系統可以分為:內存型 和 模式型的協同推薦。一般內存型的都比較直觀,適合于小型的數據集合,而模式型的一般都是利用 機器學習的方法,適用于大規模的數據分析,也可以稱之為離線分析。模式型的是我比較關心的,因為做
基于SEO的日志分析 ,比較適合。


我們在進行協同分析的時候,要考慮協同的意義。一般來說協同就是指多個用戶或多個數據項的交叉作用。如果數據項較多的情況下,如何定義數據項的關系就是個重要問題了。

下面說一下協同系統的設計要素吧:

1 數據項 Item
2 項集合 ItemCollection
3 數據項的關系權重 DirectedEdge
4 數據項在數據集合中的存儲方式









具體的算法實現過程,可以參考: Beyond Search 推薦系統:關聯規則(2) 。我這里摘錄如下:

Apriori 是一種廣度優先算法,通過多次掃描數據庫來獲取支持度大于最小支持度的頻繁項集。它的理論基礎是頻繁項集的兩個單調性原則:頻繁項集的任一子集一定是頻繁 的;非頻繁項集的任一超集一定是非頻繁的。晦澀的理論我這里就不多寫了,有興趣的可以去看論文。我把里面的例子給翻譯一下,圖文并茂,簡明易懂。
某數據庫 DB 里有 4 條事務記錄,取最小支持度(min support)為 0.5,則計算頻繁項集的過程如下:

TID Items
100 A, C, D
200 B, C, E
300 A, B, C, E
400 B, E
掃描DB
Itemset Support
{A} 2 (0.5)
{B} 3 (0.75)
{C} 3 (0.75)
{D} 1 (0.25)
{E} 3 (0.75)
取滿足
最小支持度
項集
Itemset Support
{A} 2
{B} 3
{C} 3
{E} 3
Itemset
{A, B}
{A, C}
{A, E}
{B, C}
{B, E}
{C, E}
掃描DB
Itemset Support
{A, B} 1 (0.25)
{A, C} 2 (0.5)
{A, E} 1 (0.25)
{B, C} 2 (0.5)
{B, E} 3 (0.75)
{C, E} 2 (0.5)
取滿足
最小支持度
項集
Itemset Support
{A, C} 2
{B, C} 2
{B, E} 3
{C, E} 2
Itemset
{A, B, C}
{A, B, E}
{A, C, E}
{B, C, E}
掃描DB
Itemset Support
{A, B, C} 1 (0.25)
{A, B, E} 1 (0.25)
{A, C, E} 1 (0.35)
{B, C, E} 2 (0.5)
取滿足
最小支持度
項集
Itemset Support
{B, C, E} 2 (0.5)

如上可以看出,在海量數據的情況下,Apriori 算法的運算過程有 2 個問題:

  1. 需要多次掃描數據庫,時間成本很高;
  2. 運算過程中需要產生大量的候選集,空間成本也非常高。

針對 Apriori 算法所做的 改進 也基本上是圍繞著解決這兩個問題進行的,如在掃描DB前首先進行以便事務合并和壓縮,數據分區或抽樣等。

Weka 里有 Apriori 算法的 Java 實現,非常值得一看。


推薦閱讀: 協同過濾(Collaborative Filtering)












協同推薦系統簡介


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 国产成人精品免高潮在线观看 | 日日干夜夜干 | 国产成人免费无庶挡视频 | 人人狠狠综合久久亚洲 | 欧美三级不卡 | 天天操,夜夜操 | 欧美在线小视频 | 成人网页| 欧美性爽xxxⅹbbbb | 看免费一级毛片 | 国产精品夜夜爽 | 日日干天天爽 | 新封神榜杨戬电影免费动画在线观看国语 | 成人高清在线观看 | 免费高清精品国偷自产在线 | 91久久国产综合久久 | 中国免费看的片 | 国产大片在线观看 | 日本在线观看不卡 | 999宝藏网 | 激情大乳女做爰办公室韩国 | 97理论三级九七午夜在线观看 | 在线精品亚洲欧美日韩国产 | 婷婷97狠狠的狠狠的爱 | 日本在线视频一区二区 | 免费看成年视频网页 | 中国一级毛片在线视频 | 欧美一区二区三区爽大粗免费 | 久久高清免费视频 | 中国在线播放精品区 | 色站网 | 久久综合九色综合97欧美 | 国产精品尤物在线 | 国产1区2| www一区二区| 亚洲四播房 | 欧美zozozo人禽交免费观看 | 国产人成精品一区二区三 | 中文字幕av免费 | 啪一啪在线视频 | 新版天堂资源中文在线 |