Posted on 2008-05-08 13:07
qiyadeng 閱讀(1168)
評(píng)論(0) 編輯 收藏
在剛剛結(jié)束的的WWW2008的會(huì)議中,有篇超短的paper 《Size Matters: Word Count as a Measure of Quality on Wikipedia》,這篇文章針對(duì)Wikipedia的質(zhì)量的評(píng)估,提出了一種方法來(lái)評(píng)估一個(gè)Wikipedia文章的質(zhì)量,這種方法很簡(jiǎn)單,就是數(shù)文章字?jǐn)?shù)(Word Count)。
作者認(rèn)為這種方法的好處有如下幾點(diǎn):
1.文章的長(zhǎng)度很容易測(cè)量;
2.許多其他的方法需要一些其他的信息,而這些信息不是很容易得到;
3.許多其他的方式對(duì)用戶來(lái)說(shuō)不容易理解;
4.文章的長(zhǎng)度評(píng)估的方法比其他的復(fù)雜的方法更有意義。
(說(shuō)的好像是一點(diǎn)簡(jiǎn)單^_^)這確實(shí)是一種簡(jiǎn)單的方法,但是效率怎么樣?根據(jù)作者的實(shí)驗(yàn),這個(gè)方法在二個(gè)分類(lèi)(featured and random)的情況下能得到96.3%的準(zhǔn)確率。
當(dāng)然,作者也比較實(shí)事求是,也不會(huì)夸大這種方法的作用,作者將尋找新的方法來(lái)評(píng)估Wikipedia文章質(zhì)量。
除了這篇文章,其實(shí)還有其他幾種方法,可以參看下面這些論文:
1.Information Quality Discussion in Wikipedia
2.Assessing Information Quality of a Community-Base Encyclopedia
3.Measuring Wikipedia
4.Wikipedia Article Quality Assessment and Ranking Tips for Users and Search Engine Engineers
這些文章雖然都是關(guān)于wiki質(zhì)量討論的,但是研究的意義很重大。特別是針對(duì)目前網(wǎng)絡(luò)的信息泛濫的情況下,需要用一種方式來(lái)評(píng)估信息的有用性,這樣可以讓我們更輕松找到我們需要的有用信息,同樣搜索引擎如果能判斷提供給我們的文章的質(zhì)量好壞,這也就免去了我們很多時(shí)間去挑選了。
對(duì)于推薦系統(tǒng)(如新聞、文章推薦系統(tǒng)),用戶很少評(píng)分的情況下,可以采用這種方法自動(dòng)給項(xiàng)目評(píng)分。