<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-8  評論-31  文章-0  trackbacks-0
    我在Run Nutch的時候出現(xiàn)這樣的錯誤 -

    08/07/07 04:05:41 INFO conf.Configuration: found resource crawl-urlfilter.txt at file:/home/hut/installfiles/nutch-0.9/out/production/nutch-0.9/crawl-urlfilter.txt
    08/07/07 04:05:41 INFO conf.Configuration: found resource parse-plugins.xml at file:/home/hut/installfiles/nutch-0.9/out/production/nutch-0.9/parse-plugins.xml
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetching http://www.yale.edu/
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetching http://www.harvard.edu/
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetch of http://www.harvard.edu/ failed with: org.apache.nutch.protocol.ProtocolNotFound: protocol not found for url=http
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetch of http://www.yale.edu/ failed with: org.apache.nutch.protocol.ProtocolNotFound: protocol not found for url=http

    解決方法:nutch-site.xml
        <property>
            
    <name>plugin.includes</name>
            
    <value>
                nutch-extensionpoints|
    protocol-http|urlfilter-regex|parse-(text|html|js)|index-basic|query-(basic|site|url)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)
            
    </value>
            
    <description>Regular expression naming plugin directory names to
                include. Any plugin not matching 
    this expression is excluded.
                In any 
    case you need at least include the nutch-extensionpoints plugin. By
                
    default Nutch includes crawling just HTML and plain text via HTTP,
                and basic indexing and search plugins. In order to use HTTPS please enable
                protocol
    -httpclient, but be aware of possible intermittent problems with the
                underlying commons
    -httpclient library.
            
    </description>
        
    </property>

    nutch-extensionpoints|被我錯誤的刪除了,還原以后一切工作正常. 默認情況下nutch0.9的目錄結(jié)構(gòu)中并沒有plugin.includes這個properties, 它會載入nutch-default.xml里面的plugin.includes所以定義的所有的plugin. 在nutch-site.xml編輯/加入 plugin.includes properties的目的是為了加入我們自己的plugin而覆蓋nutch-default.xml定義的.
    posted on 2008-07-10 11:38 自己的小屋 閱讀(2335) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發(fā)表評論。


    網(wǎng)站導(dǎo)航:
     
    主站蜘蛛池模板: 亚洲熟妇AV日韩熟妇在线| 亚洲电影一区二区三区| 亚洲国产精品日韩在线| 久久精品无码专区免费青青| 亚洲韩国精品无码一区二区三区| 中国内地毛片免费高清| 亚洲自偷自偷图片| 好紧我太爽了视频免费国产| 亚洲成人在线电影| 鲁大师在线影院免费观看| 亚洲综合久久1区2区3区| 91大神免费观看| 亚洲一级毛片视频| 最近2019中文字幕mv免费看| 亚洲国产成人久久综合| 国产中文字幕免费| 成全高清在线观看免费| 亚洲黄色免费观看| 思思99re66在线精品免费观看| 爱情岛亚洲论坛在线观看| 亚洲国产成人影院播放| 野花香高清视频在线观看免费 | 久久国产免费一区二区三区| 亚洲人成在线影院| 好吊妞视频免费视频| 美女一级毛片免费观看| 亚洲精品国产字幕久久不卡| 亚洲免费视频网址| 亚洲码和欧洲码一码二码三码 | 亚洲综合一区二区精品久久| 岛国片在线免费观看| eeuss免费天堂影院| 亚洲自偷精品视频自拍| 全黄a免费一级毛片人人爱| 97超高清在线观看免费视频| 亚洲成aⅴ人片在线影院八| 国产免费午夜a无码v视频| 亚洲视频免费在线观看| 亚洲第一街区偷拍街拍| 亚洲国产精品无码专区在线观看| 美女裸身网站免费看免费网站|