亚洲av成人一区二区三区,亚洲毛片免费视频,国产亚洲精品精华液

摘要: 這個工具是一個可定制的圖像抓取工具

我希望這個小工具的功能點有以下幾項：1.給定頁面抓取頁面的圖片；2.給定頁面和過濾規則，抓取頁面的圖片并存到本地磁盤或內存；

主要的技術點不多：1.圖片鏈接的獲取（htmlparser搞定）；2.圖片的讀寫（imageIo搞定）；3.規則的制定（來源于需求）

介于方法的多樣，第一個版本的spider只是很簡單的功能實現，未來希望加入的就是可擴展的規則對象

少廢話，上代碼：
閱讀全文

posted @ 2011-11-02 15:43 changedi 閱讀(2069) | 評論 (1) | 編輯收藏

工具包系列(1)：htmlStat工具——統計頁面信息

摘要: htmlStat主要想做什么，就是統計頁面的信息，我一直認為頁面的結構設計是設計人員按照思維套路來進行的。數字往往反映了一個設計的一個很重要的方面，比如它使用的各個tag的比例，文字的數量，圖片的數量和大小等等。而想學習理解出這一套思路，先統計頁面信息是最重要的。

當然先說下開發環境：jdk1.6.11，maven2，git

主要的依賴目前只在pom中更新了一部分，有加入的會慢慢加入，具體可以看github上的項目信息

有愿意一起玩代碼的，可以留言我，
閱讀全文

posted @ 2011-10-31 13:28 changedi 閱讀(2126) | 評論 (3) | 編輯收藏

tomcat流程總結

posted @ 2011-09-27 14:54 changedi 閱讀(2363) | 評論 (2) | 編輯收藏

工作半年的心得總結

posted @ 2011-08-20 07:46 changedi 閱讀(626) | 評論 (0) | 編輯收藏

手機wap頁面前端的一點體會

posted @ 2011-06-07 09:03 changedi 閱讀(19203) | 評論 (1) | 編輯收藏

總結一下幾天前的LCS算法編寫

摘要: 沒有過多的技術含量，只是拿來分享一下LCS算法的實現閱讀全文

posted @ 2011-06-03 10:18 changedi 閱讀(2600) | 評論 (0) | 編輯收藏

工作3個月小結

posted @ 2011-05-14 14:01 changedi 閱讀(459) | 評論 (0) | 編輯收藏

commons-pool學習筆記

摘要: Object pool就是一個管理對象的池子。新版本利用jdk 1.5以后的特性，結合泛型，而不是利用Object來實現了。閱讀全文

posted @ 2011-05-06 10:53 changedi 閱讀(6157) | 評論 (6) | 編輯收藏

調試技巧（隨時總結）

摘要: 調試技巧（隨時總結）：

F5單步進入（在需要進入某步方法時）

F6單步調試（一般用于單步執行）

F7單步跳出（跳出該調試區段方法）

F8調試恢復

閱讀全文

posted @ 2011-04-25 15:45 changedi 閱讀(375) | 評論 (0) | 編輯收藏

JTidy的一些小tips

摘要: 今天看了一下JTidy的使用，目的就是為了格式化一個不標準的html到標準的xhtml。
JTidy是一個用java寫的HTML語法檢查器，用JTidy可以檢查并修正語法不正確的html，同時還可以對html的DOM進行分析。Xhtml和html有很多不同，其中幾個主要的區別是
閱讀全文

posted @ 2011-04-19 21:33 changedi 閱讀(1972) | 評論 (0) | 編輯收藏

Velocity學習筆記（下）

posted @ 2011-04-07 15:43 changedi 閱讀(2670) | 評論 (2) | 編輯收藏

velocity學習筆記（上）

摘要: 雜七雜八的看了一些velocity的資料，把所見所得做個簡單不系統的筆記寫下來，算是增強記憶。

閱讀全文

posted @ 2011-04-07 11:03 changedi 閱讀(10033) | 評論 (1) | 編輯收藏

Commons-lang記錄

摘要: Commons-lang記錄：
一個最常用的工具，作為jdk的補充，有必要看一下源碼~~

閱讀全文

posted @ 2011-03-24 20:05 changedi 閱讀(2509) | 評論 (0) | 編輯收藏

spring復習速記

posted @ 2011-03-19 13:12 changedi 閱讀(596) | 評論 (0) | 編輯收藏

新的開始——紀念入職一周

posted @ 2011-02-20 14:45 changedi 閱讀(422) | 評論 (0) | 編輯收藏

bye~~2010

posted @ 2011-01-02 17:51 changedi 閱讀(323) | 評論 (0) | 編輯收藏

Commons Math學習筆記——聚類和回歸

摘要: 聚類可以見我以前寫過的聚類分析的文章。

回歸是一個統計中非常重要的概念了。在Commons Math庫中有一個regression的子包轉么實現了線性回歸的一些基本類型。在regression包中，有個基本接口就是MultipleLinearRegression，這個接口表達y=X*b+u這樣的基本線性回歸式。線性回歸是利用稱為線性回歸方程的最小二乘函數對一個或多個自變量和因變量之間關系進行建模的一種回歸分析。簡單看這個公式，y代表了一個n維的列向量（回歸子），X代表了[n,k]大小的觀測值矩陣（回歸量），b是k維的回歸參數，u是一個n維的剩余誤差。回歸分析干什么用的？具體講就是預測。我們在數據挖掘中定義，定性的分析叫做分類，而定量的分析叫做回歸。回歸就是根據已有的觀察值去預測未來的一個定量的指標。記得前一段阿里云到學院來做技術交流，講到阿里和淘寶通過數據分析對中國商品交易（還是具體什么貿易，忘記了，尷尬）的預測就是工程師做的一個簡單的線性回歸分析，模型雖然簡單，但是后來與實際數據一比較，預測值與實際值的曲線基本吻合。

閱讀全文

posted @ 2011-01-01 18:35 changedi 閱讀(6427) | 評論 (0) | 編輯收藏

Commons Math學習筆記——隨機生成和統計初步

摘要: 概率統計最基本的前提就是有數據，而我們做模擬或者測試時總會用到大量的隨機數據。我們知道絕對的隨機是做不到的，但是可以利用算法來實現偽隨機數的生成。Commons Math庫提供了一個random的包，其中定義實現了很多可以用來生成隨機數的類和接口。random包中定義了5個接口，分別是EmpiricalDistribution、NormalizedRandomGenerator、RandomData、RandomGenerator和RandomVectorGenerator。閱讀全文

posted @ 2011-01-01 18:30 changedi 閱讀(3322) | 評論 (0) | 編輯收藏

Commons Math學習筆記——分數和復數

摘要: 我們講到數學的計算，難免會遇到分數形式，因為實數的定義就是可以表示為一個分數的形式的數，而加入虛數的復數也是偶爾會遇到的。Commons Math包中的fraction和complex包就分別提供了方法來表示這兩種數。

閱讀全文

posted @ 2010-12-27 22:00 changedi 閱讀(2246) | 評論 (0) | 編輯收藏

導航

公告

隨筆分類(125)

隨筆檔案(123)

統計

留言簿(18)

積分與排名

“牛”們的博客

各個公司技術

我的鏈接

淘寶技術

閱讀排行榜

評論排行榜