前幾個月
Lucene2.
3發(fā)布,最大的變化是使用了新的索引算法,使用新的in-memory模型來大幅提升速度。我已經(jīng)全部的換成
Lucene2.
3,感覺比以前是快多了,也提供了一些更好的方法:
1.建索引更快,使用新的in-memory模型.
2.已經(jīng)有了更新索引的方法,例: doc.add( .....); Term term = new Term("ID", id);writer.updateDocument(term, doc); 這樣如果你的索引里有這記錄,它會更新操作,如果沒有,它會執(zhí)行增加操作.
3、Object Pool(對象池),Document、Field、Token的instance可以在Indexing過程中reuse,因此大幅提升了分析速度,減少了內(nèi)存分配次數(shù)。說明:類似于java中的Database Connection Pool,可重用,降低數(shù)據(jù)庫連接次數(shù)。
4、Reopen IndexReader(重新打開IndexReader),IndexReader類的reopen方法只捕捉索引中變更過的細(xì)小Index Segment,而不是重新加載完整的索引。
5、IndexWriter 調(diào)整,原來的setMaxBufferedDocs被setRAMBufferSizeMb所取代。
這是lucene2.3更改說明,大家有時間看看吧..
青菜貓(孫宇)
posted on 2008-06-16 22:59
青菜貓(孫宇) 閱讀(869)
評論(0) 編輯 收藏 所屬分類:
搜索