亚洲美女免费视频,亚洲欧美中文日韩视频,亚洲国产日韩在线

IndexWriter writer = new IndexWriter(“/data/index/”, new StandardAnalyzer(), true);
Document doc = new Document();
doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED));
doc.add(new Field("content", "lucene works well", Field.Store.YES, Field.Index.TOKENIZED));
writer.addDocument(doc);
writer.optimize();
writer.close();

下面我們分析一下這段代碼。

首先我們創建了一個writer，并指定存放索引的目錄為“/data/index”，使用的分析器為StandardAnalyzer，第三個
參數說明如果已經有索引文件在索引目錄下，我們將覆蓋它們。然后我們新建一個document。

　我們向document添加一個field，名字是“title”，內容是“lucene introduction”，對它進行存儲并索引。再添加一個名
字是“content”的field，內容是“lucene works well”，也是存儲并索引。然后我們將這個文檔添加到索引中，如果有多個文
檔，可以重復上面的操作，創建document并添加。

添加完所有document，我們對索引進行優化，優化主要是將多個segment合并到一個，有利于提高索引速度。隨后將
writer關閉，這點很重要。

如果你想把純文本文件索引起來，而不想自己將它們讀入字符串創建field，你可以用下面的代碼創建

field： Field field = new Field("content", new FileReader(file));

這里的file就是該文本文件。該構造函數實際上是讀去文件內容，并對其進行索引，但不存儲。

posted on 2012-09-19 17:22 Nirvana reborn 閱讀(396) 評論(0) 編輯收藏所屬分類: ★搜索引擎

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理

統計

公告

隨筆分類(19)

文章檔案(1)

博主鏈接

最新評論

閱讀排行榜

Lucene 學習第一天

導航