Ictclas4j
中文分詞系統是sinboy
在中科院張華平和劉群老師的研制的FreeICTCLAS
的基礎上完成的一個java
開源分詞項目,簡化了原分詞程序的復雜度,旨在為廣大的中文分詞愛好者一個更好的學習機會。
關于ICTCLAS分詞系統的討論,可以訪問google group關于ictclas分詞系統的討論組http://groups.google.com/group/ictclas
另外“春江潤楠”大哥對它還做了一些改造,大家可以參閱一下:http://chenyr.spaces.live.com/blog/cns!7BF57CE83A7A863D!394.entry。
下載地址:http://code.google.com/p/ictclas4j/downloads/list
另外還有個挺不錯的開源項目MMSeg,用起來也蠻簡單,分詞的正確度還不錯,有興趣的朋友也可以參考一下:
MMSeg,挺不錯的一個開放源代碼的中文分詞軟件包
本文作者:javaread.com