Posted on 2008-05-08 13:07
qiyadeng 閱讀(1168)
評論(0) 編輯 收藏
在剛剛結束的的WWW2008的會議中,有篇超短的paper 《Size Matters: Word Count as a Measure of Quality on Wikipedia》,這篇文章針對Wikipedia的質量的評估,提出了一種方法來評估一個Wikipedia文章的質量,這種方法很簡單,就是數文章字數(Word Count)。
作者認為這種方法的好處有如下幾點:
1.文章的長度很容易測量;
2.許多其他的方法需要一些其他的信息,而這些信息不是很容易得到;
3.許多其他的方式對用戶來說不容易理解;
4.文章的長度評估的方法比其他的復雜的方法更有意義。
(說的好像是一點簡單^_^)這確實是一種簡單的方法,但是效率怎么樣?根據作者的實驗,這個方法在二個分類(featured and random)的情況下能得到96.3%的準確率。
當然,作者也比較實事求是,也不會夸大這種方法的作用,作者將尋找新的方法來評估Wikipedia文章質量。
除了這篇文章,其實還有其他幾種方法,可以參看下面這些論文:
1.Information Quality Discussion in Wikipedia
2.Assessing Information Quality of a Community-Base Encyclopedia
3.Measuring Wikipedia
4.Wikipedia Article Quality Assessment and Ranking Tips for Users and Search Engine Engineers
這些文章雖然都是關于wiki質量討論的,但是研究的意義很重大。特別是針對目前網絡的信息泛濫的情況下,需要用一種方式來評估信息的有用性,這樣可以讓我們更輕松找到我們需要的有用信息,同樣搜索引擎如果能判斷提供給我們的文章的質量好壞,這也就免去了我們很多時間去挑選了。
對于推薦系統(如新聞、文章推薦系統),用戶很少評分的情況下,可以采用這種方法自動給項目評分。