<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 30,  comments - 3,  trackbacks - 0
    大致內容:
    這篇論文的任務是對twitter上的短文本進行分類,分到預先定義的5個類別中:news,event,opinions,deal,PM(private message)。該論文摒棄傳統的BOW特征模型而別出心裁地選取了8個特征(8F):
    1個是名詞性特性:用戶。這個特征是8F特征中最為主要的特征,因為它反映了信息源的主要類別特征。如,企業的用戶和個人用戶通常有著不同的用戶行為,這個特征可以限定該用戶tweet的分類范圍。
    另外7個是binary feature(存在特征):
    俚語與詞語縮寫的使用:俚語和詞語縮寫通常不會是一個新聞
    time-event短語:Event類別的重要特征
    評論性詞語:Opinion類重要特征
    詞語的強調(大寫或字母重要,如veeery):同上
    currency和percentage標志:如¥$%,這些都是Deal類別的重要特征
    @usrname:這是PM的重要特征,當然也有可能是Event類中的一個特征(participants)。
    實驗表明8F比BOW在精度上均為大幅提高。

    使用工具:
    weka

    論文:
    Bharath Sriram, Dave Fuhry, Engin Demir, Hakan Ferhatosmanoglu, Murat Demirbas:Short Text Classification in Twitter to Improve Information Filtering. Proceeding of the 33rd international ACM SIGIR conference on Research and development in information retrieval, Jul. 2010

    論文鏈接:
    SIGIR2010_Short_Text_Classification_in_Twitter_to_Improve_Information_Filtering.pdf
    posted on 2012-02-18 12:32 Seraphi 閱讀(1290) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 可以免费观看的毛片| 日韩久久无码免费毛片软件| 久久99精品视免费看| 伊人亚洲综合青草青草久热| 免费视频成人国产精品网站 | 4480yy私人影院亚洲| a级男女仿爱免费视频| 亚洲精品无码久久久久去q| 成人A毛片免费观看网站| 亚洲热线99精品视频| 日韩精品无码免费专区午夜不卡| 国产亚洲午夜高清国产拍精品| 国产激情久久久久影院老熟女免费| 国产精品亚洲αv天堂无码| 无码日韩人妻AV一区免费l | 国产亚洲欧洲精品| 精品在线免费观看| 久久久亚洲AV波多野结衣 | 亚洲 自拍 另类小说综合图区 | 黄色片免费在线观看| 亚洲国产精品国自产拍电影| 18观看免费永久视频| 亚洲精品第一综合99久久| 午夜神器成在线人成在线人免费| 日日摸日日碰夜夜爽亚洲| 精品国产人成亚洲区| 一区二区三区观看免费中文视频在线播放 | 精品国产免费人成网站| 久久亚洲AV成人出白浆无码国产| 日韩亚洲国产高清免费视频| WWW国产亚洲精品久久麻豆| 亚洲一区二区三区影院| 男女免费观看在线爽爽爽视频| 亚洲AV无码成人精品区狼人影院 | 日韩亚洲变态另类中文| 中文字幕免费在线看线人| 国产成人亚洲精品91专区高清| 亚洲午夜久久久久久噜噜噜| 精品香蕉在线观看免费| 亚欧国产一级在线免费| 亚洲一卡二卡三卡四卡无卡麻豆|