<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    天 霽

    那天風(fēng)大,搜搜的
    posts - 4, comments - 36, trackbacks - 1, articles - 1
      BlogJava :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

    Nutch數(shù)據(jù)查看工具:RedmuTool

    Posted on 2006-12-16 16:10 天霽 閱讀(3601) 評(píng)論(15)  編輯  收藏 所屬分類(lèi): nutch

    ??????? 在nutch的開(kāi)發(fā)過(guò)程中,很多程序員都煩惱nutch抓取數(shù)據(jù)后的保存格式,無(wú)法被直接瀏覽和管理,我也同樣煩惱,呵呵,也是被人催得急了,抽出時(shí)間寫(xiě)了這么個(gè)小工具,用來(lái)瀏覽nutch保存的數(shù)據(jù)。

    ??????? 準(zhǔn)備設(shè)計(jì)的功能有3塊:
    ??????? 1。瀏覽和管理數(shù)據(jù)。
    ??????? 2。搜索數(shù)據(jù)。
    ????????3。導(dǎo)出nutch數(shù)據(jù)到指定數(shù)據(jù)庫(kù)。

    ??????? 花了一天時(shí)間先寫(xiě)了第一塊的一部分,能夠?yàn)g覽nutch抓取后的數(shù)據(jù),先放在blog上吧,版本定為0.1,其實(shí)0.1也高,0.01比較合適。寫(xiě)的匆忙,代碼比較簡(jiǎn)陋,本想開(kāi)放源碼,又怕貽笑大方,暫時(shí)先不發(fā)布源碼了,只發(fā)布了一個(gè)jar包,代碼并沒(méi)有經(jīng)過(guò)混淆,如果感興趣反編譯過(guò)來(lái)看就好了,或者留個(gè)郵箱,等到基本功能完成了發(fā)布到sourceforge上。

    ????????基本界面使用說(shuō)明:

    ?????? 一.?? 下載與安裝:

    ??????????????? 在這里下載,下載后解壓縮,兩個(gè)解壓縮文件:RedmuTool.jar,startup.bat,一個(gè)類(lèi)包文件
    ??????????????? 夾:lib。確認(rèn)這三個(gè)在同一文件夾下。

    ???????二.?? 運(yùn)行:

    ?????????????? 執(zhí)行startup.bat。界面如下:


    ?????????? 主界面出現(xiàn)后,F(xiàn)ile-->open,選擇nutch抓取后保存數(shù)據(jù)的文件夾:


    ???????菜單中不同的選項(xiàng)對(duì)應(yīng)不同的文件夾:
    ?????? NutchCrawl,對(duì)應(yīng)你選擇的Crawl根目錄。
    ?????? CrawlDB,對(duì)應(yīng)crawldb文件夾。
    ?????? LinkDB,對(duì)應(yīng)linkdb文件夾。
    ?????? Segments,對(duì)應(yīng)segments文件夾。
    ?????? segment文件夾下是按照抓取時(shí)間命名的文件夾,內(nèi)部分別是content,crawl_fetch,crawl_generate,crawl_parse,parse_data,parse_text,界面中對(duì)應(yīng)的分別是:Content,CrawlFetch,ParseData和ParseText。
    ??????? 點(diǎn)擊相應(yīng)的選擇,就會(huì)看到相應(yīng)的數(shù)據(jù)內(nèi)容:

    ????????
    ????????字段名和相應(yīng)的屬性名相同,未做更多的處理。
    ???????
    ???????? 在使用中任何意見(jiàn)均可留言,或發(fā)送郵件到:redmuer@hotmail.com


    評(píng)論

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2006-12-16 16:49 by BeanSoft
    支持原創(chuàng)! 不管 SWT/SWING, 做出有用的東西來(lái)就是好鳥(niǎo)!

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2006-12-16 19:15 by stme
    不錯(cuò),本人正在研究nutch,有機(jī)會(huì)向您請(qǐng)教下

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2006-12-24 22:14 by baodijun
    你好!我在使用你的軟件導(dǎo)數(shù)據(jù)時(shí),卻什么數(shù)據(jù)都沒(méi)有出來(lái)。不知道是為什么?
    卻出現(xiàn)了下面的內(nèi)容。希望能得到幫助,謝謝。
    06/12/24 22:01:06 INFO conf.Configuration: parsing jar:file:/E:/nutch%e5%b7%a5%e
    5%85%b7/lib/hadoop-0.4.0.jar!/hadoop-default.xml

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2006-12-25 16:07 by 天霽
    請(qǐng)查看目錄選擇是否正確。
    你所提供的信息表示jar包加載正確。

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2007-01-10 11:06 by moonucool
    現(xiàn)在nutch最新版的為nutch_0.8.1 要與時(shí)俱過(guò)呀 支持你

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2007-01-25 21:51 by 雨山
    在網(wǎng)上搜到這個(gè)頁(yè)面真是激動(dòng)死了,下載了先。明天安裝一下試試。多謝了阿!!你真是太、太、太好了:)

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2007-03-09 19:38 by 陳軍
    支持

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2007-04-03 18:43 by Nutch初學(xué)者
    正在學(xué)習(xí)Nutch,這個(gè)工具很帥阿。能留下聯(lián)系辦法嗎?有關(guān)Nutch的問(wèn)題請(qǐng)教

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2007-04-04 09:47 by Nutch初學(xué)者
    為什么我用dump出來(lái)的數(shù)據(jù),里面的中文全是亂麻呢?~~

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2007-04-04 09:47 by Nutch初學(xué)者
    為什么我用dump出來(lái)的數(shù)據(jù),里面的中文全是亂碼呢?~~

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2007-04-13 10:58 by 天霽
    發(fā)到我郵箱里的提問(wèn)我都回復(fù)了,不過(guò)有的回復(fù)好像失敗了。
    前一段項(xiàng)目壓力比較大,沒(méi)能繼續(xù)更新這個(gè)小工具,馬上項(xiàng)目快結(jié)束了,會(huì)繼續(xù)更新這個(gè)工具,歡迎大家繼續(xù)交流。
    我的msn和郵箱在redmutool的幫助里都有顯示,有問(wèn)題在這里提出或者發(fā)郵件都可以。

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool[未登錄](méi)  回復(fù)  更多評(píng)論   

    2008-06-18 16:21 by lee
    請(qǐng)問(wèn)有沒(méi)有解決dump出來(lái)亂碼的問(wèn)題阿!知道請(qǐng)聯(lián)系leehyokug@163.com

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2012-04-22 20:41 by 桑尼~
    我們最近也在研究Nutch哇~ 能不能給我發(fā)一份哇~ 萬(wàn)分感謝哇~
    snygirl@126.com 呵呵 @天霽

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2013-05-09 18:04 by qtshh
    感謝樓主的奉獻(xiàn)精神;謝謝了;可惜沒(méi)有下載成功!

    # re: Nutch數(shù)據(jù)查看工具:RedmuTool  回復(fù)  更多評(píng)論   

    2013-05-09 18:05 by qtshh
    發(fā)我一份吧,謝謝了!zhch_china@sina.com

    只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。


    網(wǎng)站導(dǎo)航:
     
    主站蜘蛛池模板: 最近2022中文字幕免费视频| 国产免费av片在线无码免费看| 亚洲精品无码久久久久YW| 亚洲AV无码之日韩精品| 久久精品电影免费动漫| 亚洲日韩国产一区二区三区在线| 亚洲免费一区二区| 毛片高清视频在线看免费观看| 一个人晚上在线观看的免费视频| 久久精品国产亚洲av影院| 四虎亚洲国产成人久久精品| 99精品一区二区免费视频| 欧洲亚洲综合一区二区三区| 亚洲小视频在线观看| 国产国产成年年人免费看片| 三年片在线观看免费大全电影| 亚洲日本VA午夜在线影院| 亚洲AV无码乱码国产麻豆穿越| 国产无遮挡裸体免费视频| 99久久久国产精品免费牛牛四川| 无套内射无矿码免费看黄| 亚洲精品国产情侣av在线| 久久久久噜噜噜亚洲熟女综合| 人妻视频一区二区三区免费| 日韩免费在线观看视频| 国产亚洲成在线播放va| 亚洲 欧洲 自拍 另类 校园| 亚洲人成网www| 久久伊人亚洲AV无码网站| 热99re久久精品精品免费| 日韩内射激情视频在线播放免费 | 亚洲国产一成久久精品国产成人综合| 97视频免费观看2区| 久久av免费天堂小草播放| 亚洲AV无码一区二区三区鸳鸯影院| 亚洲一区影音先锋色资源| 亚洲香蕉成人AV网站在线观看| 国产在线ts人妖免费视频| 免费黄色app网站| 免费看国产精品3a黄的视频| 男女超爽刺激视频免费播放|