<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    自由,平等,開源,分享

      BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
      2 Posts :: 61 Stories :: 3 Comments :: 0 Trackbacks

      召回率(Recall Rate)(查全率):是檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率,衡量的是檢索系統的查全率。
      精度(Precision)(查準率):是檢索出的相關文檔數與檢索出的文檔總數的比率,衡量的是檢索系統的查準率。

      對于一個檢索系統來講,召回率和精度不可能兩全其美:召回率高時,精度低,精度高時,召回率低。
      所以常常用 11 種召回率下 11 種精度的平均值來衡量一個檢索系統的精度。
      對于搜索引擎系統來講,因為沒有一個搜索引擎系統能夠搜集到所有的 Web 網頁,所以召回率很難計算。
      目前的搜索引擎系統都非常關心精度。

      影響一個搜索引擎系統的性能有很多因素,最主要的是信息檢索模型,包括文檔和查詢的表示方法、評價文檔和用戶查詢相關性的匹配策略、查詢結果的排序方法和用戶進行相關度反饋的機制。

      從一個大規模數據集合中檢索文檔的時,可把文檔分成四組:

        ※ 系統檢索到的相關文檔(A)
        ※ 系統檢索到的不相關文檔(B)
        ※ 相關但是系統沒有檢索到的文檔(C)
        ※ 相關但是被系統檢索到的文檔(D)

    相關 不相關
    檢索到 A B
    未檢索到 C D

      直觀的說,一個好的檢索系統檢索到的相關文檔越多越好,不相關文檔越少越好。

      召回率 R:用檢索到相關文檔數作為分子,所有相關文檔總數作為分母,即 R=A/(A+C)
      精度 P:用檢索到相關文檔數作為分子,所有檢索到的文檔總數作為分母,即 P=A/(A+B)

      舉例:一個數據庫有 500 個文檔,其中有 50 個文檔符合定義的問題;系統檢索到 75 個文檔,但其中只有 45 個文檔符合定義。

        召回率:R=45/50=90%。
        精度:P=45/75=60%。

      上例中:系統檢索是比較有效的,召回率為 90%;但是結果有很大的噪音,有近一半的檢索結果是不相關。

      研究表明:在不犧牲精度的情況下,獲得一個高召回率是很困難的;召回率越高,精度下降的很快,而且這種趨勢不是線性的。

    posted on 2008-05-08 09:22 龍震 閱讀(1540) 評論(0)  編輯  收藏 所屬分類: 概念,術語,基礎,理解
    主站蜘蛛池模板: 国产亚洲精品岁国产微拍精品| 国产成人无码区免费A∨视频网站 国产成人涩涩涩视频在线观看免费 | 亚洲熟妇AV乱码在线观看| 37pao成人国产永久免费视频| 久久亚洲国产视频| 久久一本岛在免费线观看2020| 无码乱人伦一区二区亚洲| 最近免费视频中文字幕大全| 亚洲色偷偷av男人的天堂| 成人浮力影院免费看| 亚洲伊人精品综合在合线| 成年男女免费视频网站| 亚洲AV无码片一区二区三区| 免费国产综合视频在线看 | 亚洲一区二区三区播放在线| 免费无码AV片在线观看软件| 最近2019中文字幕mv免费看| 在线综合亚洲欧洲综合网站| 男人都懂www深夜免费网站| 国产无遮挡裸体免费视频| 深夜福利在线免费观看| 亚洲AV无码一区二三区| 中文字幕在线免费观看视频| 亚洲成人在线电影| 精品久久久久久久久免费影院| 亚洲精品宾馆在线精品酒店| www.亚洲精品.com| 久久免费高清视频| 亚洲成a人片在线网站| 韩国日本好看电影免费看| 亚洲一本综合久久| 久久久久久久久免费看无码| 国产午夜亚洲精品不卡免下载| 亚洲日韩小电影在线观看| 18未年禁止免费观看| 亚洲AV无码男人的天堂| 亚洲男人的天堂www| 一个人免费观看在线视频www| 亚洲色图综合网站| 国产乱子伦精品免费无码专区 | 美女内射毛片在线看免费人动物|