<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 0, comments - 77, trackbacks - 0, articles - 356
      BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

    Java 全文本搜索引擎工具

    Posted on 2008-03-15 09:02 semovy 閱讀(610) 評論(0)  編輯  收藏 所屬分類: 搜索引擎

    Egothor   點擊次數:10000

    Egothor是一個用Java編寫的開源而高效的全文本搜索引擎。借助Java的跨平臺特性,Egothor能應用于任何環境的應用,既可配置為單獨的搜索引擎,又能用于你的應用作為全文檢索之用。

    Nutch   點擊次數:13225

    Nutch 是一個開源Java 實現的搜索引擎。它提供了我們運行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬蟲。

    Lucene   點擊次數:16817

    Apache Lucene是一個開放源程序的搜尋器引擎,利用它可以輕易地為Java軟件加入全文搜尋功能。Lucene的最主要工作是替文件的每一個字作索引,索引讓搜尋的效率比傳統的逐字比較大大提高,Lucen提供一組解讀,過濾,分析文件,編排和使用索引的API,它的強大之處除了高效和簡單外,是最重要的是使使用者可以隨時應自已需要自訂其功能。

    Oxyus   點擊次數:8694

    是一個純java寫的web搜索引擎。

    BDDBot   點擊次數:7831

    BDDBot是一個簡單的易于理解和使用的搜索引擎。它目前在一個文本文件(urls.txt)列出的URL中爬行,將結果保存在一個數據庫中。它也支持一個簡單的Web服務器,這個服務器接受來自瀏覽器的查詢并返回響應結果。它可以方便地集成到你的Web站點中。

    Zilverline   點擊次數:8484

    Zilverline是一個搜索引擎,它通過web方式搜索本地硬盤或intranet上的內容。Zilverline可以從PDF, Word, Excel, Powerpoint, RTF, txt, java, CHM,zip, rar等文檔中抓取它們的內容來建立摘要和索引。從本地硬盤或intranet中查找到的結果可重新再進行檢索。Zilverline支持多種語言其中包括中文。

    XQEngine   點擊次數:7235

    XQEngine用于XML文檔的全文本搜索引擎.利用XQuery做為它的前端查詢語言.它能夠讓你查詢XML文檔集合通過使用關鍵字的邏輯組合.有點類似于Google與其它搜索引擎搜索HTML文檔一樣.XQEngine只是一個用Java開發的很緊湊的可嵌入的組件.

    MG4J   點擊次數:7054

    MG4J可以讓你為大量的文檔集合構建一個被壓縮的全文本索引,通過使內插編碼(interpolative coding)技術.

    JXTA Search   點擊次數:7694

    JXTA Search是一個分布式的搜索系統.設計用在點對點的網絡與網站上.

    YaCy   點擊次數:7283

    YaCy基于p2p的分布式Web搜索引擎.同時也是一個Http緩存代理服務器.這個項目是構建基于p2p Web索引網絡的一個新方法.它可以搜索你自己的或全局的索引,也可以Crawl自己的網頁或啟動分布式Crawling等.

    Red-Piranha   點擊次數:7753

    Red-Piranha是一個開源搜索系統,它能夠真正"學習"你所要查找的是什么.Red-Piranha可作為你桌面系統(Windows,Linux與Mac)的個人搜索引擎,或企業內部網搜索引擎,或為你的網站提供搜索功能,或作為一個P2P搜索引擎,或與wiki結合作為一個知識/文檔管理解決方案,或搜索你要的RSS聚合信息,或搜索你公司的系統(包括SAP,Oracle或其它任何Database/Data source),或用于管理PDF,Word和其它文檔,或作為一個提供搜索信息的WebService或為你的應用程序(Web,Swing,SWT,Flash,Mozilla-XUL,PHP, Perl或c#/.Net)提供搜索后臺等等.

    LIUS   點擊次數:7749

    LIUS是一個基于Jakarta Lucene項目的索引框架。LIUS為Lucene添加了對許多文件格式的進行索引功能如:
    Ms Word,Ms Excel,Ms PowerPoint,RTF,PDF,XML,HTML,TXT,Open Office序列和JavaBeans。針對JavaBeans的索引特別有用當我們要對數據庫進行索引或剛好用戶使用持久層ORM技術如:Hibernate,JDO,Torque,TopLink進行開發時。

    Aperture   點擊次數:7380

    Aperture這個Java框架能夠從各種各樣的資料系統(如:文件系統、Web站點、IMAP和Outlook郵箱)或存在這些系統中的文件(如:文檔、圖片)爬取和搜索其中的全文本內容與元數據。它當前支持的文件格式如下:

  • Plain text
  • HTML, XHTML
  • XML
  • PDF (Portable Document Format)
  • RTF (Rich Text Format)
  • Microsoft Office: Word, Excel, Powerpoint, Visio, Publisher
  • Microsoft Works
  • OpenOffice 1.x: Writer, Calc, Impress, Draw
  • StarOffice 6.x - 7.x+: Writer, Calc, Impress, Draw
  • OpenDocument (OpenOffice 2.x, StarOffice 8.x)
  • Corel WordPerfect, Quattro, Presentations
  • Emails (.eml files)

  • 只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 99亚洲精品高清一二区| 亚洲高清无码专区视频| 91嫩草私人成人亚洲影院| 99久久成人国产精品免费| 亚洲欧洲国产精品你懂的| 久久九九久精品国产免费直播| 巨胸狂喷奶水视频www网站免费| 亚洲av无码成人精品区| 国产日韩精品无码区免费专区国产 | 亚洲国产老鸭窝一区二区三区| 免费福利电影在线观看| 免费视频中文字幕| 久久精品国产69国产精品亚洲| 国产成人AV免费观看| 久久久久亚洲精品天堂| 最近2019中文免费字幕| 日本亚洲中午字幕乱码| 在线亚洲午夜理论AV大片| 亚洲爆乳成av人在线视菜奈实| 曰皮全部过程视频免费国产30分钟| 亚洲av乱码中文一区二区三区| 国产一区二区视频免费| 国产精品成人免费观看| 亚洲产国偷V产偷V自拍色戒 | 91成人免费福利网站在线| 老汉色老汉首页a亚洲| 女人18毛片水真多免费看| 四虎国产精品成人免费久久| 亚洲精品~无码抽插| h片在线免费观看| 免费在线观看亚洲| 亚洲男人第一av网站| 成人免费一区二区无码视频| 亚洲综合激情视频| 在线观看免费大黄网站| 国产裸体美女永久免费无遮挡| 亚洲最大黄色网站| 亚洲精品国产高清嫩草影院 | 国产精品视频免费一区二区三区| 国产又黄又爽胸又大免费视频| 亚洲妓女综合网99|