終于回到北京了,結束了將近一年的差旅生涯,結束和飛來飛去,提心吊膽的日子
不用再去想飛機上的顫抖了,不用再去想有人劫持我的飛機撞向某個高層建筑物了,呵呵!
1.下半的目標和計劃很多也很亂,慢慢安排,首先要把駕駛照考完,這個考試比較簡單吧,而且還打賭了考100分就有500塊錢賺,呵呵。然后學車!<2008-11>
2.下半年還要復習CFA考試,力爭先把Level 1過了,學好金融基礎知識,弄好第一塊“磚頭”。<2009-6>
3.另外還要develop一個package供自己使用,包含對股票,期貨等金融衍生產品的定價模型的一些methods,沒有找到關于隨機漫步方法的計算機支持,只有自己開發一套了。<2009-10>
4.深入的學習一下SAS建模的知識,爭取時間學會寫SAS EM代碼(比較難了)。<2009-10>
5.最想做的還有一件事情,自己開發一套分析紙黃金價格波動的軟件(基于定價理論),市面上的都不好用。這個雖然比較難,但是我最喜歡做這個事情,自己搞投機一定要自己用心。<2009-12>
6.四個大的目標夠我忙活一陣子了!
充實自己的生活!
===================
<今年的CFA是重中之重>
新買的CFA的書:
6大本Notes,全英文,夠我喝一壺的了,以后每天晚上就是啤酒加英文的日子了。

還有六本教科書,更沒個看,英文,涉及方面太多了。
期間還要學習,貨幣金融,投資組合,金融數學……
回北京真好,充實自己的生活!
數據挖掘(Data Mining)時下是一個很流行的詞語,網上隨便搜搜便有成把成把的文章為你講述它的起源、發展等歷史。
至于這個行業真正落地的應用個人認為在每個行業都不一樣,我做過互聯網行業,電信移動,銀行的也看過,記錄一下我的體會和感受。互聯網領域,這些年在 google的帶領下,技術日益飛進,真是3天不學習就感覺落后了,在這樣進步的情況下,必然伴隨著行業的激烈競爭,有一些公司開始做數據挖掘,畢竟沒有競爭的挖掘做完了也不會有人用,就算用了,也不會重視你,這點我在移動的感覺非常深刻,了解互聯網做數據挖掘的情況最好就是先去看看各個公司招人的情況,一般這樣會直接暴露出公司想做的方向,深入的思考就會得到很多信息,這里列舉一個比較有名的互聯網公司的招聘信息:
數據挖掘工程師
崗位職責:
1.負責數據挖掘領域的分析研究,包括數據挖掘算法的分析研究,特定工程的數據挖掘模型的需求分析、建模、實驗模擬;
2.負責數據挖掘系統的開發,包括需求分析、系統設計、系統測試和優化。
任職資格:
1.計算機或數學相關專業畢業,碩士以上學歷;有數據挖掘2年以上的研究或數據挖掘項目實施經驗;
2.3年以上的Oracle數據庫的應用軟件開發經驗,非常熟悉Oracle存儲過程腳本編寫,熟悉PL/SQL的開發技術,良好的SQL開發和調優優化技能;
3.3年以上數據挖掘 / 數據倉庫 / ETL相關工作經驗, 具有深厚的統計學、數學、人工智能和數據挖掘知識基礎;
4.熟悉海量數據處理和挖掘的基本算法,有電信或者教育行業數據挖掘、多維分析項目經驗者優先;
5.熟悉互聯網應用,具備Web Service知識,熟悉Spring,Struts等框架;
6.優秀的JAVA/J2EE編程能力,能夠使用JAVA獨立實現復雜的算法結構;熟悉C/C++/Perl/python更佳;
7.快速的學習和研究能力,良好的溝通能力及團隊協作能力。
從上面不難看出點問題,這不是招人,這是在暴露自己的問題,第一公司想招人的目的性不明確,想做什么也不明確,我們對這個招聘做一個分析,簡單的分析。
首先看Coding能力,會Java,這個不難,市場上人很多,但是能實現獨立的算法結構,這不僅僅指簡單的算法,數據結構什么的,要實現的是很多復雜的數學計算式、決策樹變種、聚類、關聯、時序等等復雜算法,這個可不是一般人能做到的,反正我還沒這個水平,估計5年內很難達到,即使有也是google的人了;
其次,要求中寫著做過數據倉庫的項目,DW的項目國內一般都在電信、移動、銀行,做這個的人和做互聯網的人思維方式工作手法完全不同,可以說傳統行業是比較規范的,規范到每個指標,數據統計口徑都要有文檔支持,雖然也有很多臨時需求,但是比起規范性來,互聯網差遠了,反過來講互聯網的優勢在于靈活,基于 DM能出現更多的新的小應用,傳統行業里面比如電信,DM主要做三個方面的東西,集團規范里面有明確的要求:關聯,增量模型,流失模型,對應起來就是關聯分析一般是做產品交叉銷售,增量模型和流失模型都是預測型模型,Dtree、回歸來做新增預測,客戶流失什么的,個別省份也會做客戶細分 (clustering做的),一般這些東西都有一套方法論,一套工作流程,一套完整的開發文檔,規范一直到最后的提交物,另外有著DW系統的強大支持,軟件工具的支持,比如IBM DB2,Oracle DW,NCR Teradata。各家也有工具提供業務人員和技術人員使用,IBM Miner,Oracle達爾文,NCR TWM,還有SAS,spss的DM軟件是相當強悍的,畢竟人家的軟件開發了那么多年,賣的貴也是有道理的。以上都說明了,這些傳統行業的DM應用還是比互聯網成熟的多的。說道互聯網就挺新穎得了,隨著搜索的發展,這些年只要想做Mining的都是想在基于搜索來做,MSRA有一個結果聚類的小應用,就是這樣一個方向,另外互聯網研究的clickstream也是較為成功的方向,盡管好的應用模式還沒有出現。
另外說金融保險領域也是和互聯網領域的Mining區別超級大的,金融的巴塞爾是比較火的,風險管理等等。信用卡欺詐預測……,保險縮減理賠流程時間……,這年頭都在講流程銀行,我不明白是啥東西,也沒學過,反正牛人都在說,要學的東西太多了。
深層次思考一下就會明白,這樣的招聘是根本招不到人的,我承認有牛人存在,什么都強,但是這樣畢竟少數,可以說是極品中的極品,懂數學,懂Mining,懂統計,能Coding,懂數據倉庫,所以互聯網的Mining,尤其在web2.0成熟之后招人最好還是基于開發招比較合理,因為這樣慢慢的過渡才能出現一些比較成型,成體系的小型的Mining應用,才能收到實際效果。一般都是做搜索的人開始做這些東西,畢竟做搜索的人基礎還是不錯的。
另外業界和學校是不同的,經常聽身邊好多Ph.D講他們那時候寫文章的事情,有些還是比較有用的,但是畢竟產業界和學術界有著本質的區別,產業界要賺錢,學術界就是寫文章,呵呵,都知道文章是怎么回事。
最后,互聯網領域,無論是IM,web Service,Blog等等都需要一些方向建立一些成功的小應用,我喜歡的幾個地方有clickstream,cloud,tag system。讓我們一起期待著在web上也有類似CRM這種應用時代的到來,預祝Web Mining越做越好!
雜文一篇,牛人不要罵,呵呵
今天解決了這幾個纏繞在一起的問題,還是實踐出真知啊,呵呵
首先是JDK的設置問題:
設置好JDK和一般所需要的開發環境,我不是那種喜歡在論壇里面天天吵哪個IDE好,哪個IDE差的人,呵呵那么多IDE,既然存在,總有理由,不然就會完蛋,而且那么多IDE總會有不同的人去用,正所謂蘿卜白菜各有所愛,呵呵。我呢,很早就明白了一個道理,IDE是那些大公司寫的,又不是我開發的,用來賺錢的,錢又不給我,所以不要那么賣命的替他們推廣就行了,呵呵,用著哪個舒服就ok了,不用太較真了,不要成為大公司的IDE奴隸,想象一下,成為一個閑云野鶴那樣穿梭在開發的世界,不被一切世俗的環境所左右,那是多么神往啊。偶爾回頭看看論壇里面罵上了:eclipse比netbeans好,netbeans比eclipse好,兩幫瘋子,呵呵。
用著舒心就好了,人家開發出來就有理由的,好不好人家自己明白,就不要再想了,今天玩玩這個,明天玩玩那個,換著用還開發大腦智力呢。
前幾天我用netBeans中文顯示不了全是框框,就不用了,用了幾天eclipse,后來找到了解決方法,又玩了玩,呵呵換著用嗎,開心就好。方法就是在netbenas的高級選項中把字體的默認值改成DialgoInput的,呵呵為什么呢?因為這個才支持Unicode碼,這個不知道就查查去。昨天晚上在試驗JDK的方法時候以前的UltraEdit不能編譯Java了出現了奇怪的問題”創建進程錯誤“,唉后來發現不是大事,是自己不小心把”交互式捕捉方式“的小對號給勾去了,應該勾上,要不然怎么能將信息捕捉到輸出窗口呢,呵呵。Editplus的配置也是一樣,有時候覺得這個兩個東西更好,看書學習的時候很有幫助練習基礎知識,不用啟動IDE那么大的東西,而且加入編譯或者運行參數很簡單比如-verbose什么的,看上去很美,Art!
如果不知道,怎么讓這么多的IDE一起和諧工作,我以后再寫出來吧。可能元旦做個總結,呵呵
今天把NetBeans換成中文版了,先從中文的開始適應吧,呵呵。
不過今天使用的時候還是遇到了很多問題,很是郁悶,呵呵,不過遇到問題也好啊,至少是個學習的機會。
最后還是沒有解決在NetBeans中漢字顯示小方框的問題,氣死我了。
網上也有很多解決的辦法我一一試驗,最后還是失敗了。
把他們列出來,希望有人能最終解決,我先得想想。
這個問題一定要解決,除非是Sun的問題。
這個是找來的方法,傳說中有人解決了,不過不使用這兩種方法
NetBeans在Debian中的中文全是方框1.在 jre/lib/fonts/ 下建立個目錄
mkdir /usr/local/jdk1.5.0_06/jre/lib/fonts/fallback/
2.復制一個中文字體到該目錄
cp /usr/share/fonts/truetype/fonts/simsun.ttc /usr/local/jdk1.5.0_06/jre/lib/fonts/fallback/
3.進入 jre/lib/fonts/sim/
cd /usr/local/jdk1.5.0_06/jre/lib/fonts/fallback/
執行 mkfontscale
4.把得到的 fonts.scale 內容加到 jre/lib/fonts/fonts.dir
注意修改 fonts.dir 第一行得數字。
找到中文不能顯示的解決辦法了
修改 netbeans 安裝目錄/etc/netbeans.conf,設置一下字體大小即可
netbeans_default_options="-J-Xms32m -J-Xmx128m -J-Xverify:none --fontsize 11"
隨便設成11、12、13、14都可以,不知道究竟為什么
以上兩個方法都試驗過了,還是不行。郁悶ing。
我的系統是Microsoft Windows XP Tablet PC Edition 2005 版本2002 Service Pack2
NetBeans 5.5 zh_CN