<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-295  評論-26  文章-1  trackbacks-0
    字符串切分
    ?package demo.analysis;
    ?
    ?import java.io.IOException;
    ?
    ?import jeasy.analysis.MMAnalyzer;
    ?
    ?public class Segment?
    ?{
    ????????
    ???? public static void main(String[] args)?
    ???? {
    ???????? String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,"
    ??????????????? + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡,"
    ??????????????? + "20000余人受傷,近20萬人無家可歸。";?
    ?????????
    ???????? MMAnalyzer analyzer = new MMAnalyzer();
    ???????? try?
    ???????? {
    ???????????????? System.out.println(analyzer.segment(text, " | "));
    ???????? }?
    ???????? catch (IOException e)?
    ???????? {
    ???????????????? e.printStackTrace();
    ???????? }
    ???? }
    ?}
    ?
    生成效果:
    據 | 路透社 | 報道 | 印度尼西亞 | 社會 | 事務 | 部 | 官員 | 星期二 | 29日 | 表示 | 日惹 | 市 |
    附近 | 當地時間 | 27日 | 晨 | 5時 | 53分 | 發生 | 里氏 | 6.2級 | 地震 | 已經 | 造成 | 至少 |
    5427人 | 死亡 | 20000 | 余人 | 受傷 | 近 | 20萬人 | 無家可歸 |
    ?
    Lucene搜索
    ?package demo.analysis;
    ?
    ?import jeasy.analysis.MMAnalyzer;
    ?
    ?import org.apache.lucene.analysis.Analyzer;
    ?import org.apache.lucene.document.Document;
    ?import org.apache.lucene.document.Field;
    ?import org.apache.lucene.index.IndexWriter;
    ?import org.apache.lucene.queryParser.QueryParser;
    ?import org.apache.lucene.search.Hits;
    ?import org.apache.lucene.search.IndexSearcher;
    ?import org.apache.lucene.search.Query;
    ?import org.apache.lucene.store.Directory;
    ?import org.apache.lucene.store.RAMDirectory;
    ?
    ?public class Segment?
    ?{
    ?????
    ???? public static void main(String[] args)?
    ???? {
    ???????? String fieldName = "text";
    ???????? String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,"
    ???????????? + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡,"
    ???????????? + "20000余人受傷,近20萬人無家可歸。"; //檢索內容
    ?
    ???????? //采用正向最大匹配的中文分詞算法
    ???????? Analyzer analyzer = new MMAnalyzer();
    ?
    ???????? Directory directory = new RAMDirectory();
    ???????? //Directory directory = FSDirectory.getDirectory("/tmp/testindex", true);
    ?
    ???????? try
    ????????? {
    ???????????? IndexWriter iwriter = new IndexWriter(directory, analyzer, true);
    ???????????? iwriter.setMaxFieldLength(25000);
    ???????????? Document doc = new Document();
    ???????????? doc.add(new Field(fieldName, text, Field.Store.YES, Field.Index.TOKENIZED));
    ???????????? iwriter.addDocument(doc);
    ???????????? iwriter.close();
    ?????????????
    ???????????? IndexSearcher isearcher = new IndexSearcher(directory);
    ???????????? QueryParser parser = new QueryParser(fieldName, analyzer);
    ???????????? Query query = parser.parse("印度尼西亞 6.2級地震");//檢索詞
    ???????????? Hits hits = isearcher.search(query);
    ???????????? System.out.println("命中:" + hits.length());
    ?
    ???????????? for (int i = 0; i < hits.length(); i++)?
    ???????????? {
    ???????????????? Document hitDoc = hits.doc(i);
    ???????????????? System.out.println("內容:" + hitDoc.get(fieldName));
    ???????????? }
    ?
    ???????????? isearcher.close();
    ???????????? directory.close();
    ???????? }?
    ???????? catch (Exception e)?
    ???????? {
    ???????????? e.printStackTrace();
    ???????? }???
    ???? }
    ?????
    ?}
    ?
    生成效果:
    命中:1
    內容:據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,日惹市附近當地時間27日晨5時53分發生的
    里氏6.2級地震已經造成至少5427人死亡,20000余人受傷,近20萬人無家可歸。
    搜索詞加亮
    ?package demo.analysis;
    ?
    ?import jeasy.analysis.MMAnalyzer;
    ?
    ?import org.apache.lucene.analysis.Analyzer;
    ?import org.apache.lucene.analysis.TokenStream;
    ?import org.apache.lucene.document.Document;
    ?import org.apache.lucene.document.Field;
    ?import org.apache.lucene.index.IndexReader;
    ?import org.apache.lucene.index.IndexWriter;
    ?import org.apache.lucene.index.TermPositionVector;
    ?import org.apache.lucene.queryParser.QueryParser;
    ?import org.apache.lucene.search.Hits;
    ?import org.apache.lucene.search.IndexSearcher;
    ?import org.apache.lucene.search.Query;
    ?import org.apache.lucene.search.highlight.Highlighter;
    ?import org.apache.lucene.search.highlight.QueryScorer;
    ?import org.apache.lucene.search.highlight.TokenSources;
    ?import org.apache.lucene.store.Directory;
    ?import org.apache.lucene.store.RAMDirectory;
    ?
    ?public class Segment
    ?{
    ?
    ???? public static void main(String[] args)
    ???? {
    ???????? String fieldName = "text";
    ???????? String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,"
    ???????????? + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡,"
    ???????????? + "20000余人受傷,近20萬人無家可歸。"; //檢索內容
    ?
    ???????? //采用正向最大匹配的中文分詞算法
    ???????? Analyzer analyzer = new MMAnalyzer();
    ?
    ???????? Directory directory = new RAMDirectory();
    ???????? //Directory directory = FSDirectory.getDirectory("/tmp/testindex", true);
    ?
    ???????? try
    ???????? {
    ???????????? IndexWriter iwriter = new IndexWriter(directory, analyzer, true);
    ???????????? iwriter.setMaxFieldLength(25000);
    ???????????? Document doc = new Document();
    ???????????? doc.add(new Field(fieldName, text, Field.Store.YES,
    ???????????????????? Field.Index.TOKENIZED,
    ???????????????????? Field.TermVector.WITH_POSITIONS_OFFSETS));
    ???????????? iwriter.addDocument(doc);
    ???????????? iwriter.close();
    ?
    ???????????? IndexSearcher isearcher = new IndexSearcher(directory);
    ???????????? QueryParser parser = new QueryParser(fieldName, analyzer);
    ???????????? Query query = parser.parse("印度尼西亞 6.2級地震");//檢索詞
    ???????????? Hits hits = isearcher.search(query);
    ???????????? System.out.println("命中:" + hits.length());
    ?
    ???????????? Highlighter highlighter = new Highlighter(new QueryScorer(query));
    ???????????? for (int i = 0; i < hits.length(); i++)
    ???????????? {
    ???????????????? text = hits.doc(i).get(fieldName);
    ???????????????? TermPositionVector tpv = (TermPositionVector) IndexReader.open(
    ???????????????????? directory).getTermFreqVector(hits.id(i), fieldName);
    ???????????????? TokenStream tokenStream = TokenSources.getTokenStream(tpv);
    ???????????????? String result = highlighter.getBestFragments(tokenStream, text, 3, "...");
    ???????????????? System.out.println("內容:" + result);
    ???????????? }
    ?
    ???????????? isearcher.close();
    ???????????? directory.close();
    ???????? }
    ???????? catch (Exception e)
    ???????? {
    ???????????? e.printStackTrace();
    ???????? }
    ???? }
    ?
    ?}
    ?
    生成效果:
    命中:1
    內容:據路透社報道,<B>印度尼西亞</B>社會事務部一官員星期二(29日)表示,日惹市附近當地時間27日晨
    5時53分發生的里氏<B>6.2級</B><B>地震</B>已經造成至少5427人死亡,20000余人受傷,近20萬人無家可歸


    大盤預測 國富論
    posted on 2008-10-29 10:21 華夢行 閱讀(902) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 一个人看的免费视频www在线高清动漫| 亚洲国产日韩在线人成下载| 国产小视频在线免费| 亚洲成人黄色网址| 亚洲免费视频播放| 亚洲精品福利你懂| 国产人成网在线播放VA免费| 日韩精品成人无码专区免费 | 亚洲国产人成网站在线电影动漫| 黄 色一级 成 人网站免费| 免费亚洲视频在线观看| 人妻无码中文字幕免费视频蜜桃| 在线a亚洲v天堂网2018| 91亚洲性爱在线视频| 91手机看片国产永久免费| 久久亚洲精品中文字幕三区| 成全视频高清免费观看电视剧| 久久久亚洲欧洲日产国码农村| 一级做a爰片久久毛片免费陪| 中文字幕专区在线亚洲| 立即播放免费毛片一级| 亚洲福利在线播放| 色天使亚洲综合一区二区| jjizz全部免费看片| 亚洲成人激情小说| 久久久久亚洲av成人无码电影 | 自怕偷自怕亚洲精品| 中文字幕无码成人免费视频| 亚洲精品无播放器在线播放 | 亚洲AV区无码字幕中文色| 免费毛片a在线观看67194| 久久夜色精品国产亚洲AV动态图| 暖暖在线视频免费视频| 亚洲AV永久纯肉无码精品动漫| 91福利视频免费观看| 亚洲精品蜜夜内射| 久久精品九九亚洲精品天堂| 大学生一级毛片免费看| 最近免费字幕中文大全| 456亚洲人成在线播放网站| 久久久久亚洲精品天堂久久久久久|