amazon , netflix, hulu , youtube
ItemCF 並不利用物品的內容屬性計算物品之間的相似度,他主要通過分析用戶行為記錄物品的相似度。
算法認為:A 和B 相似,是由於喜歡A 的用戶大都也喜歡B
利用用戶的歷史行為給推薦結果提供推薦解釋。例如喜歡或者收藏過的射雕,推薦天龍八部。
1、計算物品相似度
2、根據物品相似度和用戶的歷史行為生成推薦列表
Wij = |同時喜歡物品i,j 的人數| / |喜歡物品i的人數|
懲罰熱門物品:
Wij = |同時喜歡物品i,j 的人數| / sqrt(喜歡i 的人數x 喜歡j的人數) **
計算用戶u對壹個物品的興趣:
Puj = sum(Sji, Rui) j (- 和j 最類似的k個物品集合
該公式的含義是:
**和用戶歷史上感興趣的物品越相似的物品,越可能在用戶的推薦列表中獲得高排名。
itemCF 流行度效果更好些,但是準確率隨k值提高沒有改善。
1、IUF
Sij = cij /match.sqrt(N[i]*N[j]) 計算物品相似度
弱化,那麽僅僅忽略 Cij = (1+1/log(1+N(u))
2、當然也可以忽略掉活躍度過高的用戶。
W' ij = wij / maxJ(wij) 按類歸壹化
歸壹化後,覆蓋率能夠提高4個百分點