北大ppt 文本挖掘技術系列之五--TextMining05-聚類
聚類概述
|
概念
|
|
|
|
|
應用
|
|
|
|
|
步驟
|
|
|
|
|
評價
|
|
|
|
|
聚類準則函數
|
|
|
|
|
聚類算法
[文檔間距離,類間距離]
|
劃分方法
|
K-means [分析,缺陷,改進]
|
|
|
|
|
K-mediods[PAM算法,CLARA算法,CLARANS算法]
|
|
|
|
|
|
層次方法
|
凝聚
|
AGNES (1990)
|
改進的層次聚類
1. Birch
2. CURE
3. ROCK
4. Chameleon
|
|
單鏈接,全連接,組平均鏈接
|
|
分裂
|
DIANA (1990)
|
|
密度方法
|
DBSCAN
|
|
|
|
OPTICS
|
|
|
|
DENCLUE
|
|
|
|
CLIQUE
|
|
|
|
|
|
網格方法
|
CLIQUE
|
|
|
|
|
|
(孤立點分析)
|
基于統計
|
|
|
|
基于距離
|
|
|
|
基于偏離
|
|
|
|
在線聚類 STC
|
|
|
|
注:對k-means的改進版介紹比較詳細,另外對STC部分分析比較深刻,看來下階段我需要身體力行下,看看STC的效果。邊做邊看論文吧,哈哈
http://m.tkk7.com/Files/fullfocus/05.pdf
posted on 2008-06-18 22:13
fullfocus 閱讀(1835)
評論(0) 編輯 收藏 所屬分類:
聚類算法研究