商業智能與實驗室智能
Blog剛開張說些什么好呢?就談一談學術界流行的數據挖掘吧。
???數據挖掘本來就是數據分析,用數學和統計的方法分析已有的數據。可是這個概念在商業上和學術上卻產生的天地一般的差別,在商業上,數據挖掘指的實際就是數據庫的整合和查詢,最多加上一些非常簡單的算法,比如關聯,就成了所謂的數據挖掘系統,再者就干脆理解為OLAP和報表制作;而學術上呢?要是你翻開Datamining的教科書或者論文集,你要擔心了,除非你是個數學系的畢業生,否則你絕對不會理解里面概念、公式和結論。為什么有這么大的差別呢?從軟件工程的角度來看,原來商人和學者的需求完全不同,商人不需要高深的理論,什么樣的工具對生意有用,對管理有用,就用什么工具,最好直觀可信易懂;但學者正好相反,要發表論文沒有創新不行,因此越來越多艱深的理論被寫入論文。這樣造就了兩個截然不同的數據挖掘領域。
???其實要說都不一樣也不確切,許多優秀可行的分析方法在時間的考驗中沉淀下來,逐步進入了商業領域,同時商業管理系統包括ERP,CRM也越來越注重新方法的應用,看來商業和學術也不是兩條平行線。
???我們java人能做什么呢?看到許多領域:B/S、GIS、ERP、CAD乃至數據庫都有相應的開源軟件群了,而數據分析和挖掘卻一直很少人問津,并不是它沒有用,而是DM要求的門檻較高,更需要耐心和恒心,因此希望越來越多的人關注開源數據分析/挖掘的實現。
posted on 2007-01-02 16:06 Lieffert Liu 閱讀(786) 評論(2) 編輯 收藏