<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    sunfruit[請?jiān)L問http://www.fruitres.cn]

    --我相信JAVA能走得更遠(yuǎn) QQ:316228067

    全文檢索技術(shù)概述

    --sunfruit

    ??????? 最近做了一個(gè)資料管理軟件用來管理日常資料,編寫好了基本功能以后總是感覺這個(gè)軟件缺少了什么,是的,是全文檢索,沒有全文檢索功能,這個(gè)管理軟件用到最后也一定對于查找資料相當(dāng)困難,于是加緊趕工加上了作為基本功能的全文檢索。
    ??????? 有人了解檢索技術(shù),而且也不是什么高深技術(shù),我也不班門弄斧,就是把原理大概介紹一下,感興趣的朋友也可以自己嘗試編寫一下。
    ??????? 全文檢索技術(shù)其實(shí)就是用空間換時(shí)間--用硬盤空間換取檢索時(shí)間。
    ??????? 首先需要字索引,要想建立字索引就需要字庫,這個(gè)字庫其實(shí)就是每一個(gè)漢字,大概6000個(gè)漢字左右吧,再加上a-z,A-Z,0-9,基本上就可以作為字索引的字庫了,然后就是利用字庫生成字索引。
    ????????生成字索引的原來就是以字庫為基礎(chǔ),為字庫里面的每一個(gè)字做索引,在每一個(gè)文章里面做匹配,把一個(gè)文章里面所有的匹配的位置記錄下來,舉個(gè)例子:比如字庫里面的"啊",如果現(xiàn)在要建立"啊"的索引,那么要遍歷所有要做索引的文章,把所有的"啊"的位置要記錄下來,當(dāng)然要可以區(qū)分位置是哪個(gè)文章的,要不然混成一堆,就沒有意義了[因?yàn)樽詈髾z索索引的最終目的是要定位出文章的ID],這樣就形成了字索引。依此類推,所有漢字的字索引,索引建立就完成了
    ??????? 檢索索引,這個(gè)是關(guān)鍵的關(guān)鍵,速度是否快,全看這里,當(dāng)然索引建立的合理與否也能影響檢索速度,舉個(gè)例子:比如要查詢"業(yè)務(wù)"這個(gè)關(guān)鍵詞,
    ??????? 首先在字索引中查到"業(yè)": 在文件號11111 中的位置有11,40,99? 在文件號11112 中的位置有22,33,45
    ???????? 然后在字索引中查到"務(wù)": 在文件號11111 中的位置有12,66,100? 在文件號11112 中的位置有27,39,60

    ??????? 經(jīng)過計(jì)算會得到命中的文件號為 11111 ,因?yàn)闃I(yè)務(wù)必須位置號碼要連續(xù)的出現(xiàn)才算命中

    ??????? 大概的思路就是這樣
    ?????? 當(dāng)然檢索技術(shù)還會有詞索引技術(shù),根據(jù)字索引可以進(jìn)一步生成詞索引,并且有切詞技術(shù)。。。就不多說了
    ???????
    ??????? 那個(gè)資料管理軟件的DEMO下載地址 http://m.tkk7.com/sunfruit/archive/2006/04/01/38625.html
    ??????? DEMO的界面樣式如下
    ??????? 檢索界面
    ????????Shell00.jpg
    ??????? 主界面
    ????????Shell01.jpg

    ??????? 注意:使用全文檢索的時(shí)候,首先要生成索引[在工具菜單欄里面],并且不能重復(fù)生成同一個(gè)文章的索引,而只能重新生成,這個(gè)在生成的時(shí)候有選項(xiàng),因?yàn)槿绻貜?fù)生成那么在字索引里面就會重復(fù)記錄,到時(shí)候檢索的時(shí)候就會檢索出來多個(gè)同樣的文章了

    posted on 2006-04-05 00:20 sunfruit 閱讀(2555) 評論(2)  編輯  收藏 所屬分類: JAVA SE & EE

    評論

    # re: 全文檢索技術(shù)概述 2006-04-05 14:09 lizongbo



    為什么不用lucene呢?

    曾經(jīng)有過想用lucene做一個(gè)類似樓主的工具的程序。

    結(jié)果因?yàn)樘珣卸鴽]有做了:(


      回復(fù)  更多評論   

    # re: 全文檢索技術(shù)概述 2006-04-05 14:44 sun fruit

    自己嘗試一下檢索制作過程,原理上一樣

    lucene聽說過,一直沒有嘗試,這段時(shí)間也在看,吸取一些經(jīng)驗(yàn)  回復(fù)  更多評論   

    主站蜘蛛池模板: 女人18一级毛片免费观看| 青青草无码免费一二三区| 免费观看成人毛片a片2008| 精品人妻系列无码人妻免费视频| 午夜高清免费在线观看| 亚洲精品人成网在线播放影院| A级毛片成人网站免费看| 在线亚洲精品福利网址导航| 一级黄色免费大片| 在线精品一卡乱码免费| 亚洲精品无码99在线观看| 日韩大片免费观看视频播放 | 人人狠狠综合久久亚洲高清| 亚洲AV成人无码网天堂| 亚洲国产精品人人做人人爽| 九九全国免费视频| 久久91亚洲人成电影网站| 99re在线精品视频免费| 国产精品亚洲专区在线观看| 嫩草影院免费观看| 日日摸夜夜添夜夜免费视频| 亚洲精品美女久久777777| 亚洲av成人一区二区三区观看在线| 四虎永久免费影院在线| 亚洲中文久久精品无码1| 国产精品免费观看久久| 色www免费视频| 亚洲国产人成网站在线电影动漫| 13一14周岁毛片免费| 亚洲av无码成人影院一区| 国产成人精品日本亚洲专区61| 一级毛片成人免费看免费不卡| 中文字幕亚洲天堂| 真人无码作爱免费视频| 妞干网在线免费观看| 黄色一级毛片免费| 激情内射亚洲一区二区三区| 黄页网站在线视频免费| 亚洲AV永久无码精品一百度影院| 2020久久精品国产免费| sss日本免费完整版在线观看|