Posted on 2007-01-26 17:36
王睿 閱讀(1317)
評(píng)論(0) 編輯 收藏 所屬分類:
搜索技術(shù)
1.??????
2.0
以前的版本
-
Keyword: Field
的值將被保存到索引文件,為Field的值建立索引,建立索引時(shí)不需要分詞。
-
UnIndexed: Field
的值將被保存到索引文件,不為Field的值建立索引,因此不能通過該Field搜索文檔。
-
UnStored: Field
的值不被保存到索引文件,將Field的值分詞后建立索引
-
Text: Field
的值分詞后建立索引。如果參數(shù)為String值將被保存,為Reader值不被保存
2.??????
2.0
版本
? 用幾個(gè)內(nèi)部類的組合來區(qū)分Field的具體類型。
2???????
COMPRESS:
壓縮保存。用于長文本或二進(jìn)制數(shù)據(jù)
2???????
YES
:保存
2???????
NO
:不保存
2???????
NO
:不
建索引
2???????
TOKENIZED
:分詞,
建索引
2???????
UN_TOKENIZED
:不分詞,
建索引
2???????
NO_NORMS
:不分詞,
建索引。但是Field的值不像通常那樣被保存,而是只取一個(gè)byte,這樣節(jié)約存儲(chǔ)空間
2???????
NO
:
不保存term vectors
2???????
YES
:
保存term vectors。
2???????
WITH_POSITIONS
:
保存term vectors。(保存值和token位置信息)
2???????
WITH_OFFSETS
:
保存term vectors。(保存值和Token的offset)WITH_POSITIONS_OFFSETS:保存term vectors。(保存值和token位置信息和Token的offset)