術(shù)語:
followee/friend 用戶關(guān)注的對象(即新浪微博中的“關(guān)注”)
follower 關(guān)注用戶的對象(即微博中的“粉絲”)
collaborative filtering 協(xié)同過濾
大致內(nèi)容:
本文作者及其團(tuán)隊對twitter用戶推薦做了深入研究,并制作了一個在線的twitter用戶推薦的應(yīng)用。并以profile推薦和search推薦兩種方式呈現(xiàn)給用戶。
profile推薦即用戶不需要自己輸入查詢,該應(yīng)用將根據(jù)用戶的profile自動生成查詢,來查找相關(guān)用戶。
search推薦即用戶自行輸入查詢,來尋找自己感興趣的用戶。
本文列舉了9種生成用戶profile的策略:
S1:由用戶U本身的tweets
S2:由用戶U的followees的tweets產(chǎn)生
S3:由用戶U的followers的tweets產(chǎn)生
S4:由S1,S2,S3的并集產(chǎn)生
S5:由用戶U的followee ID產(chǎn)生
S6:由用戶U的follower ID產(chǎn)生
S7:由S5,S6并集產(chǎn)生
S8:結(jié)合S1-S7,得分函數(shù)依賴于S1和S6
S9:結(jié)果S1-S7,得分函數(shù)基于推薦列表中用戶位置。
※以上方法中,S1-S4為content based,S5-S7是collaborative filtering。
然后用lucene對這9種策略分別建立索引,進(jìn)行實(shí)驗(yàn)。其中,基于內(nèi)容的策略中,采用tf-idf權(quán)值。
評價指標(biāo):
1、①Precision:即推薦列表與已有followee重復(fù)的百分比,S5-S7(Collaborative filtering)好于S1-S4(content based),S3高于S2,Precision隨Recommendation List Size增大而降低
②Position:相關(guān)用戶的位置因素亦很重要,在此,基于內(nèi)容方法略好于協(xié)同過濾。
2、以上兩個指標(biāo)均為脫機(jī)(offline)評價指標(biāo),實(shí)際上即便是followee中沒有存在的那些出現(xiàn)在Recommendation List中的用戶,也并非不相關(guān),有很多為potential followees。因此,本文還做了一個live-user trial,選取了34位參與者參加實(shí)驗(yàn),結(jié)果30個推薦列表中,平均采取6.9人,且位置主要集中在推薦列表的top10。另外,search中(31名參與)結(jié)果并不如profile,平均4.9人采納。作者分析了這個原因,在于search中用戶所提供信息遠(yuǎn)小于profile中的信息,因此效果不如profile推薦。
論文:
John Hannon, Mike Bennett, Barry Smyth:Recommending Twitter Users to Follow Using Content and Collaborative Filtering Approaches.
Proceedings of the fourth ACM conference on Recommender systems, Sep. 2010論文鏈接:
2010_RECSYS_RecommendingTwitterUsers.pdf
posted on 2012-02-18 11:28
Seraphi 閱讀(675)
評論(0) 編輯 收藏