<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-8  評論-31  文章-0  trackbacks-0
      2007年3月12日
    我在Run Nutch的時候出現(xiàn)這樣的錯誤 -

    08/07/07 04:05:41 INFO conf.Configuration: found resource crawl-urlfilter.txt at file:/home/hut/installfiles/nutch-0.9/out/production/nutch-0.9/crawl-urlfilter.txt
    08/07/07 04:05:41 INFO conf.Configuration: found resource parse-plugins.xml at file:/home/hut/installfiles/nutch-0.9/out/production/nutch-0.9/parse-plugins.xml
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetching http://www.yale.edu/
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetching http://www.harvard.edu/
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetch of http://www.harvard.edu/ failed with: org.apache.nutch.protocol.ProtocolNotFound: protocol not found for url=http
    08/07/07 04:05:41 INFO fetcher.Fetcher: fetch of http://www.yale.edu/ failed with: org.apache.nutch.protocol.ProtocolNotFound: protocol not found for url=http

    解決方法:nutch-site.xml
        <property>
            
    <name>plugin.includes</name>
            
    <value>
                nutch-extensionpoints|
    protocol-http|urlfilter-regex|parse-(text|html|js)|index-basic|query-(basic|site|url)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)
            
    </value>
            
    <description>Regular expression naming plugin directory names to
                include. Any plugin not matching 
    this expression is excluded.
                In any 
    case you need at least include the nutch-extensionpoints plugin. By
                
    default Nutch includes crawling just HTML and plain text via HTTP,
                and basic indexing and search plugins. In order to use HTTPS please enable
                protocol
    -httpclient, but be aware of possible intermittent problems with the
                underlying commons
    -httpclient library.
            
    </description>
        
    </property>

    nutch-extensionpoints|被我錯誤的刪除了,還原以后一切工作正常. 默認(rèn)情況下nutch0.9的目錄結(jié)構(gòu)中并沒有plugin.includes這個properties, 它會載入nutch-default.xml里面的plugin.includes所以定義的所有的plugin. 在nutch-site.xml編輯/加入 plugin.includes properties的目的是為了加入我們自己的plugin而覆蓋nutch-default.xml定義的.
    posted @ 2008-07-10 11:38 自己的小屋 閱讀(2335) | 評論 (0)編輯 收藏
    Nutch0.9 Crawl在Run的時候,有時候會出現(xiàn) -


    java.lang.ArrayIndexOutOfBoundsException: -1

    at org.apache.lucene.index.MultiReader.isDeleted(MultiReader.java:
    113)

    at org.apache.nutch.indexer.DeleteDuplicates$InputFormat$DDRecordReader.next(DeleteDuplicates.java:
    176)

    at org.apache.hadoop.mapred.MapTask$
    1.next(MapTask.java:157)

    at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:
    46)

    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:
    175)

    at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:
    126)

    Exception in thread 
    "main" java.io.IOException: Job failed!

    at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:
    604)

    at org.apache.nutch.indexer.DeleteDuplicates.dedup(DeleteDuplicates.java:
    439)

    at org.apache.nutch.crawl.Crawl.main(Crawl.java:
    135)

    問題的解決方法:

    https://issues.apache.org/jira/browse/NUTCH-525?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel#action_12515955



    posted @ 2008-07-10 11:32 自己的小屋 閱讀(611) | 評論 (0)編輯 收藏
    那是2007年三月二日,我發(fā)了<定位Java類中的每個方法在類文件中的位置>
    引起了幾個大蝦的注意并且給我指點,當(dāng)時看了以后也沒有怎么弄,也不知道怎么弄.

    這是cape給我的建議:

    最直接的辦法應(yīng)該是分析class的bytecode,找到每個Method_info->Code Attribute->LineNumberTable Attribute

    今天空閑得慌而是我拿這個method linenumber幾個keyword在網(wǎng)上狂搜了一把,
    http://www.ibm.com/developerworks/cn/java/j-dyn0302/index.html

    得到美文一篇,用Javassist來做. Javassist是一個專門操控java class的bytecode的類,可以動態(tài)的改變其狀態(tài),我沒有深究它到底有多大的能耐,有興趣可以去它的官方網(wǎng)站看看,

    http://www.csg.is.titech.ac.jp/~chiba/javassist/

    但是它確實可以象cape指點的那樣,讓我實現(xiàn)對java類中的每個方法的定位(得到類中的某個方法的lineRange)

    而是我就隨便翻了幾個例子以后根據(jù)在線文檔寫了不到100行代碼輕松搞定。:) 我高興啊。

    干這個事情的兩個java的source code可以從這里得到:

    http://m.tkk7.com/Files/xmp123/MethodParser.zip

    代碼很簡單,我就不解釋代碼了。

    這是示例結(jié)果:
    ------------------------------------------------------------------------------------------------------------------------------
    Analyzing net.blogjava.xmp123.MyMethodInfo ...
    net.blogjava.xmp123.MyMethodInfo.getLineList() locate between 56 and 56

    net.blogjava.xmp123.MyMethodInfo.updateLineList() locate between 63 and 80

    net.blogjava.xmp123.MyMethodInfo.addLineToLineList(int) locate between 87 and 89

    net.blogjava.xmp123.MyMethodInfo.setLineList(java.util.List) locate between 95 and 97
    ...
    ------------------------------------------------------------------------------------------------------------------------------

    希望這東西有用......
    posted @ 2007-08-15 17:56 自己的小屋 閱讀(1138) | 評論 (0)編輯 收藏
         摘要:   閱讀全文
    posted @ 2007-03-12 15:40 自己的小屋 閱讀(2260) | 評論 (9)編輯 收藏
    主站蜘蛛池模板: 国产亚洲精品资在线| 亚洲国产精品久久| 美女无遮挡拍拍拍免费视频 | 国产一级a毛一级a看免费视频| 亚洲高清国产拍精品26U| 97国产免费全部免费观看| 亚洲人成色77777在线观看| 亚洲爽爽一区二区三区| 97公开免费视频| 美女羞羞免费视频网站| 久久亚洲私人国产精品| 日韩成人免费aa在线看| 国产日韩一区二区三免费高清| 亚洲av乱码一区二区三区| 亚洲国产日韩在线观频| 最近最好最新2019中文字幕免费| 亚洲国产精品ⅴa在线观看| 亚洲阿v天堂在线| 好吊妞视频免费视频| 91免费福利视频| 色欲aⅴ亚洲情无码AV蜜桃| 久久国产亚洲高清观看| 国产又大又黑又粗免费视频| 久久国产乱子伦精品免费一| WWW国产亚洲精品久久麻豆| 亚洲网站免费观看| 亚洲国产精品综合久久一线 | 免费看片在线观看| 黄色网址在线免费观看| 亚洲资源最新版在线观看| 亚洲国产三级在线观看| 四虎影在线永久免费四虎地址8848aa| 24小时免费看片| 久久最新免费视频| 精品特级一级毛片免费观看| 亚洲成年人电影在线观看| 亚洲熟妇无码八AV在线播放| 日本v片免费一区二区三区 | 亚洲乱码中文字幕综合| 免费一级做a爰片久久毛片潮喷| 精品无码免费专区毛片|