2010年12月14日
#
摘要: 簡(jiǎn)單log,一些commons-logging和log4j的東西
閱讀全文
摘要: 分享一個(gè)ThreadMonitor,來(lái)自commons-io的一段小程序,感覺(jué)會(huì)有用,拿來(lái)分享一下
閱讀全文
摘要: 框架介紹:
主要分為幾個(gè)部分,核心httpClient部分,認(rèn)證相關(guān)的token部分和api調(diào)用部分。
Weibo這個(gè)類是一個(gè)主體核心,調(diào)用的入口。
當(dāng)用戶完成上面介紹的授權(quán)后,通過(guò)weibo這個(gè)類來(lái)調(diào)用api實(shí)現(xiàn)功能。
閱讀全文
摘要: 數(shù)據(jù)類型選擇方面的幾個(gè)原則:
1,更小通常更好,選擇能正確表示數(shù)據(jù)的最小類型。
2,簡(jiǎn)單就好,用簡(jiǎn)單類型優(yōu)于用復(fù)雜類型。
3,避免NULL,盡量定義字段為not null。性能提升很小。
閱讀全文
摘要: 這個(gè)工具是一個(gè)可定制的圖像抓取工具
我希望這個(gè)小工具的功能點(diǎn)有以下幾項(xiàng):1.給定頁(yè)面抓取頁(yè)面的圖片;2.給定頁(yè)面和過(guò)濾規(guī)則,抓取頁(yè)面的圖片并存到本地磁盤或內(nèi)存;
主要的技術(shù)點(diǎn)不多:1.圖片鏈接的獲取(htmlparser搞定);2.圖片的讀寫(imageIo搞定);3.規(guī)則的制定(來(lái)源于需求)
介于方法的多樣,第一個(gè)版本的spider只是很簡(jiǎn)單的功能實(shí)現(xiàn),未來(lái)希望加入的就是可擴(kuò)展的規(guī)則對(duì)象
少?gòu)U話,上代碼:
閱讀全文
摘要: htmlStat主要想做什么,就是統(tǒng)計(jì)頁(yè)面的信息,我一直認(rèn)為頁(yè)面的結(jié)構(gòu)設(shè)計(jì)是設(shè)計(jì)人員按照思維套路來(lái)進(jìn)行的。數(shù)字往往反映了一個(gè)設(shè)計(jì)的一個(gè)很重要的方面,比如它使用的各個(gè)tag的比例,文字的數(shù)量,圖片的數(shù)量和大小等等。而想學(xué)習(xí)理解出這一套思路,先統(tǒng)計(jì)頁(yè)面信息是最重要的。
當(dāng)然先說(shuō)下開發(fā)環(huán)境:jdk1.6.11,maven2,git
主要的依賴目前只在pom中更新了一部分,有加入的會(huì)慢慢加入,具體可以看github上的項(xiàng)目信息
有愿意一起玩代碼的,可以留言我,
閱讀全文
摘要: 沒(méi)有過(guò)多的技術(shù)含量,只是拿來(lái)分享一下LCS算法的實(shí)現(xiàn)
閱讀全文
摘要: Object pool就是一個(gè)管理對(duì)象的池子。新版本利用jdk 1.5以后的特性,結(jié)合泛型,而不是利用Object來(lái)實(shí)現(xiàn)了。
閱讀全文
摘要: 調(diào)試技巧(隨時(shí)總結(jié)):
F5單步進(jìn)入(在需要進(jìn)入某步方法時(shí))
F6單步調(diào)試(一般用于單步執(zhí)行)
F7單步跳出(跳出該調(diào)試區(qū)段方法)
F8調(diào)試恢復(fù)
閱讀全文
摘要: 今天看了一下JTidy的使用,目的就是為了格式化一個(gè)不標(biāo)準(zhǔn)的html到標(biāo)準(zhǔn)的xhtml。
JTidy是一個(gè)用java寫的HTML語(yǔ)法檢查器,用JTidy可以檢查并修正語(yǔ)法不正確的html,同時(shí)還可以對(duì)html的DOM進(jìn)行分析。Xhtml和html有很多不同,其中幾個(gè)主要的區(qū)別是
閱讀全文
摘要: 雜七雜八的看了一些velocity的資料,把所見所得做個(gè)簡(jiǎn)單不系統(tǒng)的筆記寫下來(lái),算是增強(qiáng)記憶。
閱讀全文
摘要: Commons-lang記錄:
一個(gè)最常用的工具,作為jdk的補(bǔ)充,有必要看一下源碼~~
閱讀全文
摘要: 聚類可以見我以前寫過(guò)的聚類分析的文章。
回歸是一個(gè)統(tǒng)計(jì)中非常重要的概念了。在Commons Math庫(kù)中有一個(gè)regression的子包轉(zhuǎn)么實(shí)現(xiàn)了線性回歸的一些基本類型。在regression包中,有個(gè)基本接口就是MultipleLinearRegression,這個(gè)接口表達(dá)y=X*b+u這樣的基本線性回歸式。線性回歸是利用稱為線性回歸方程的最小二乘函數(shù)對(duì)一個(gè)或多個(gè)自變量和因變量之間關(guān)系進(jìn)行建模的一種回歸分析。簡(jiǎn)單看這個(gè)公式,y代表了一個(gè)n維的列向量(回歸子),X代表了[n,k]大小的觀測(cè)值矩陣(回歸量),b是k維的回歸參數(shù),u是一個(gè)n維的剩余誤差。回歸分析干什么用的?具體講就是預(yù)測(cè)。我們?cè)跀?shù)據(jù)挖掘中定義,定性的分析叫做分類,而定量的分析叫做回歸。回歸就是根據(jù)已有的觀察值去預(yù)測(cè)未來(lái)的一個(gè)定量的指標(biāo)。記得前一段阿里云到學(xué)院來(lái)做技術(shù)交流,講到阿里和淘寶通過(guò)數(shù)據(jù)分析對(duì)中國(guó)商品交易(還是具體什么貿(mào)易,忘記了,尷尬)的預(yù)測(cè)就是工程師做的一個(gè)簡(jiǎn)單的線性回歸分析,模型雖然簡(jiǎn)單,但是后來(lái)與實(shí)際數(shù)據(jù)一比較,預(yù)測(cè)值與實(shí)際值的曲線基本吻合。
閱讀全文
摘要: 概率統(tǒng)計(jì)最基本的前提就是有數(shù)據(jù),而我們做模擬或者測(cè)試時(shí)總會(huì)用到大量的隨機(jī)數(shù)據(jù)。我們知道絕對(duì)的隨機(jī)是做不到的,但是可以利用算法來(lái)實(shí)現(xiàn)偽隨機(jī)數(shù)的生成。Commons Math庫(kù)提供了一個(gè)random的包,其中定義實(shí)現(xiàn)了很多可以用來(lái)生成隨機(jī)數(shù)的類和接口。random包中定義了5個(gè)接口,分別是EmpiricalDistribution、NormalizedRandomGenerator、RandomData、RandomGenerator和RandomVectorGenerator。
閱讀全文
摘要: 我們講到數(shù)學(xué)的計(jì)算,難免會(huì)遇到分?jǐn)?shù)形式,因?yàn)閷?shí)數(shù)的定義就是可以表示為一個(gè)分?jǐn)?shù)的形式的數(shù),而加入虛數(shù)的復(fù)數(shù)也是偶爾會(huì)遇到的。Commons Math包中的fraction和complex包就分別提供了方法來(lái)表示這兩種數(shù)。
閱讀全文
摘要: 概率分布是概率論的一個(gè)基礎(chǔ)。
在Commons Math包中也專門有一個(gè)子包對(duì)概率分布進(jìn)行了封裝實(shí)現(xiàn)。在distribution包中,定義了一個(gè)基本接口Distribution。該接口只有兩個(gè)方法,一個(gè)是double cumulativeProbability(double x),一個(gè)是double cumulativeProbability(double x0, double x1)。前者對(duì)于服從某種分布的隨機(jī)變量X,返回P(X<=x);后者則返回P(x0<=X<=x1)。正如其名所示,這樣也就得到了概率。
閱讀全文
摘要: 函數(shù)方程求解,其實(shí)是函數(shù)的零點(diǎn)問(wèn)題,也就是說(shuō)函數(shù)的曲線與X軸的交點(diǎn)。對(duì)于線性方程,我們可以輕易的求解,對(duì)于線性方程組,利用前面講過(guò)的的矩陣分解方法也可以求解。那么對(duì)于函數(shù)表達(dá)的很多非線性方程的求解。我們要依賴數(shù)值算法。Commons Math包中專門有一個(gè)analysis.solver包來(lái)解決這個(gè)問(wèn)題。
閱讀全文
摘要: 積分可以說(shuō)是最常見的了,在函數(shù)的一節(jié)中我們講過(guò)函數(shù)的微分和給定變量求值,這里我們講講通過(guò)函數(shù)求積分,具體的數(shù)值積分方法和應(yīng)用。什么是數(shù)值積分?在數(shù)值分析中,數(shù)值積分是計(jì)算定積分?jǐn)?shù)值的方法和理論。在數(shù)學(xué)分析中,給定函數(shù)的定積分的計(jì)算不總是可行的。許多定積分不能用已知的積分公式得到精確值。數(shù)值積分是利用黎曼積分等數(shù)學(xué)定義,用數(shù)值逼近的方法近似計(jì)算給定的定積分值。借助于電子計(jì)算設(shè)備,數(shù)值積分可以快速而有效地計(jì)算復(fù)雜的積分。Commons Math中的積分包analysis.integration提供了幾種數(shù)值積分的實(shí)現(xiàn),UnivariateRealIntegrator接口是積分包中的基礎(chǔ)接口,該接口繼承了math包中的ConvergingAlgorithm接口。具體定義了一系列方法,其中比較主要的有double integrate(UnivariateRealFunction f, double min, double max)方法,這個(gè)方法就是通過(guò)min和max設(shè)定積分區(qū)間,通過(guò)f設(shè)定被積函數(shù),最后返回定積分值的方法。可以看到這個(gè)接口的實(shí)現(xiàn)是針對(duì)單變量實(shí)函數(shù)的。多元積分的實(shí)現(xiàn),目前還沒(méi)有看
閱讀全文
摘要: 在Commons Math中的analysis.interpolation包中有所有的與函數(shù)插值相關(guān)的類和接口定義。這一篇主要從這個(gè)包分析,來(lái)研究一下函數(shù)插值的應(yīng)用。在2.1的api doc中添加了很多新的接口和類實(shí)現(xiàn),但是2.0的source code里還是只有少量的實(shí)現(xiàn)。這里以2.0的source code為標(biāo)準(zhǔn),輔助以2.1的api doc(其實(shí)這都是不影響的)。
插值是數(shù)學(xué)領(lǐng)域數(shù)值分析中的通過(guò)已知的離散數(shù)據(jù)求未知數(shù)據(jù)的過(guò)程或方法。給定n個(gè)離散數(shù)據(jù)點(diǎn)(稱為節(jié)點(diǎn))(xk,yk),k= 1,2,...,n。對(duì)于,求x所對(duì)應(yīng)的y的值稱為內(nèi)插。f(x)為定義在區(qū)間[a,b]上的函數(shù)。x1,x2,x3...xn為[a,b]上n個(gè)互不相同的點(diǎn),G為給定的某意函數(shù)類。若G上有函數(shù)g(x)滿足: g(xi) = f(xi),k = 1,2,...n
則稱g(x)為f(x)關(guān)于節(jié)點(diǎn)x1,x2,x3...xn在G上的插值函數(shù)
閱讀全文
摘要: 在Commons Math中的analysis.polynomials包中有所有的與多項(xiàng)式函數(shù)相關(guān)的類和接口定義。這一篇主要從這個(gè)包分析,來(lái)研究一下多項(xiàng)式函數(shù)的應(yīng)用。
閱讀全文
摘要: 向量和矩陣可以說(shuō)是線性代數(shù)的代表,那么返還到高等數(shù)學(xué)中,函數(shù)就是我們最常用到的單位了,還有各種微積分和其他應(yīng)用,都是建立在變量、函數(shù)的基礎(chǔ)上的。Commons Math庫(kù)的下一個(gè)研讀部分就是針對(duì)函數(shù)這一塊。在Commons Math中也單獨(dú)有一個(gè)analysis包完成這部分實(shí)現(xiàn)。
閱讀全文