lucene是一個十分不錯的全文檢索系統(tǒng),其實在很早以前我就從放飛技術網(wǎng)(www.frontfree.net)知道了這個系統(tǒng),但沒有試用過,直到前幾天一個朋友要我?guī)退{試weblucene,我才決定試用一下lucene。
之所以說lucene不錯,是因為它與數(shù)據(jù)庫檢索系統(tǒng)比起來有許多優(yōu)點,具體的優(yōu)點你可以參考車東的一篇文章:“在應用中加入全文檢索功能 ——基于Java的全文索引引擎Lucene簡介(www.chedong.com/tech/lucene.html)”。
測試系統(tǒng)配置:WinXP Professional SP1+Java JDK1.4.2+Resin3.0.9
一、建立應用環(huán)境
1、將文件luceneweb.war復制到你的Resin3.0.9\webapps目錄下,并啟動Resin,運行IE(localhost:8080),系統(tǒng)會自動為你生成一個名為luceneweb的目錄。
2、將lucene-1.3-final.jar、lucene-demos-1.3-final.jar加入到系統(tǒng)配置的classpath中。
3、建立索引文件:
首先建立一個目錄dest,此目錄為你要檢索的對象,可以包含子目錄,并將你要索引的文件放入此目錄中(注意,只能索引 .html,.htm,.txt 三種文件格式,其它格式需要你自己修改)。
然后建立一個目錄luceneindex,此目錄存放建立好的索引文件。
運行CMD,進入你的luceneindex目錄,運行如下命令:
C:\resin-3.0.9\webapps\luceneweb\luceneindex>java org.apache.lucene.demo.IndexHTML -create -index C:\resin-2.1.6\webapps\luceneindex ../dest
此時你的luceneindex目錄下會產(chǎn)生三個文件,建立索引文件完成。
4、修改configuration.jsp文件:
將 String indexLocation = "/opt/lucene/index"; 修改為你的索引文件所在的目錄。如:
String indexLocation = "C:\\resin-3.0.9\\webapps\\luceneweb\\luceneindex";
5、一切均已完成,Enjoy it!
測試結果貼圖:
注:1、我在Tomcat 4.0上也測試了一下,但是對中文的支持真的太差了,而Resin對中文的支持確實還不錯。
2、lucene不具有實時性,這也是它的一個缺陷,需要手工建立索引和更新,當然我們可以使用線程在WEB應用中每隔一段時間就自動建立和更新一次索引,這樣便可得到改善。
posted on 2005-11-28 10:22
Robin's Programming World 閱讀(640)
評論(0) 編輯 收藏 所屬分類:
Java