<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 30,  comments - 3,  trackbacks - 0
    大致內容:
    這篇論文的任務是對twitter上的短文本進行分類,分到預先定義的5個類別中:news,event,opinions,deal,PM(private message)。該論文摒棄傳統的BOW特征模型而別出心裁地選取了8個特征(8F):
    1個是名詞性特性:用戶。這個特征是8F特征中最為主要的特征,因為它反映了信息源的主要類別特征。如,企業的用戶和個人用戶通常有著不同的用戶行為,這個特征可以限定該用戶tweet的分類范圍。
    另外7個是binary feature(存在特征):
    俚語與詞語縮寫的使用:俚語和詞語縮寫通常不會是一個新聞
    time-event短語:Event類別的重要特征
    評論性詞語:Opinion類重要特征
    詞語的強調(大寫或字母重要,如veeery):同上
    currency和percentage標志:如¥$%,這些都是Deal類別的重要特征
    @usrname:這是PM的重要特征,當然也有可能是Event類中的一個特征(participants)。
    實驗表明8F比BOW在精度上均為大幅提高。

    使用工具:
    weka

    論文:
    Bharath Sriram, Dave Fuhry, Engin Demir, Hakan Ferhatosmanoglu, Murat Demirbas:Short Text Classification in Twitter to Improve Information Filtering. Proceeding of the 33rd international ACM SIGIR conference on Research and development in information retrieval, Jul. 2010

    論文鏈接:
    SIGIR2010_Short_Text_Classification_in_Twitter_to_Improve_Information_Filtering.pdf
    posted on 2012-02-18 12:32 Seraphi 閱讀(1290) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 99热这里有免费国产精品| 亚洲人成网站18禁止| 国产免费一区二区三区免费视频| 久久WWW色情成人免费观看| 亚洲专区中文字幕| 两性刺激生活片免费视频| 亚洲精品福利在线观看| 无码av免费网站| 亚洲视频在线观看网站| 182tv免费视视频线路一二三| 亚洲乱色熟女一区二区三区丝袜| 两性色午夜免费视频| 亚洲国产精品无码av| 最好看的中文字幕2019免费| 久久精品国产亚洲AV麻豆网站 | 亚洲AV无码之日韩精品| 美女羞羞喷液视频免费| 亚洲一区二区三区在线视频| 人禽伦免费交视频播放| 国产精品亚洲精品日韩已满| 嫩草在线视频www免费观看| 亚洲福利一区二区三区| 日韩a在线观看免费观看| 五月天婷婷免费视频| 久久精品夜色国产亚洲av| av免费不卡国产观看| 亚洲国产精品无码久久98| 亚洲欧洲日产国码高潮αv| 美女网站在线观看视频免费的| 亚洲成AV人在线播放无码| 国产在线观看麻豆91精品免费| 国产精品亚洲专区一区| 国产亚洲无线码一区二区| 五月婷婷在线免费观看| 国产亚洲高清在线精品不卡| 国产亚洲成av片在线观看| 国产无人区码卡二卡三卡免费| 黄页免费视频播放在线播放| 亚洲AV中文无码字幕色三| 大学生美女毛片免费视频| 十八禁在线观看视频播放免费|