術語:
followee/friend 用戶關注的對象(即新浪微博中的“關注”)
follower 關注用戶的對象(即微博中的“粉絲”)
collaborative filtering 協同過濾
大致內容:
本文作者及其團隊對twitter用戶推薦做了深入研究,并制作了一個在線的twitter用戶推薦的應用。并以profile推薦和search推薦兩種方式呈現給用戶。
profile推薦即用戶不需要自己輸入查詢,該應用將根據用戶的profile自動生成查詢,來查找相關用戶。
search推薦即用戶自行輸入查詢,來尋找自己感興趣的用戶。
本文列舉了9種生成用戶profile的策略:
S1:由用戶U本身的tweets
S2:由用戶U的followees的tweets產生
S3:由用戶U的followers的tweets產生
S4:由S1,S2,S3的并集產生
S5:由用戶U的followee ID產生
S6:由用戶U的follower ID產生
S7:由S5,S6并集產生
S8:結合S1-S7,得分函數依賴于S1和S6
S9:結果S1-S7,得分函數基于推薦列表中用戶位置。
※以上方法中,S1-S4為content based,S5-S7是collaborative filtering。
然后用lucene對這9種策略分別建立索引,進行實驗。其中,基于內容的策略中,采用tf-idf權值。
評價指標:
1、①Precision:即推薦列表與已有followee重復的百分比,S5-S7(Collaborative filtering)好于S1-S4(content based),S3高于S2,Precision隨Recommendation List Size增大而降低
②Position:相關用戶的位置因素亦很重要,在此,基于內容方法略好于協同過濾。
2、以上兩個指標均為脫機(offline)評價指標,實際上即便是followee中沒有存在的那些出現在Recommendation List中的用戶,也并非不相關,有很多為potential followees。因此,本文還做了一個live-user trial,選取了34位參與者參加實驗,結果30個推薦列表中,平均采取6.9人,且位置主要集中在推薦列表的top10。另外,search中(31名參與)結果并不如profile,平均4.9人采納。作者分析了這個原因,在于search中用戶所提供信息遠小于profile中的信息,因此效果不如profile推薦。
論文:
John Hannon, Mike Bennett, Barry Smyth:Recommending Twitter Users to Follow Using Content and Collaborative Filtering Approaches.
Proceedings of the fourth ACM conference on Recommender systems, Sep. 2010論文鏈接:
2010_RECSYS_RecommendingTwitterUsers.pdf
posted on 2012-02-18 11:28
Seraphi 閱讀(676)
評論(0) 編輯 收藏