Krabber是用于抽取網頁中HTML信息的工具。最為重要的是,Krabber可以執行網頁中的JavaScript,并網頁在JavaScript執行后的,被修改的HTML返回回來,提供給Java程序調用,以便能夠更好的支持Web 2.0環境下的網頁信息抓取。
啊列啊列,經過了超長時間的掙扎,終于做好了第一個可以運行的版本。參與項目開發的同學從對C++與Java完全不了解到逐漸的熟悉并開始進步,實在是相當不容易啊,贊一個。我本科的時候要是有這個水平,沒準現在就牛X了。
比較慚愧的是,由于涉足開源領域的經驗不足,沒有很好的整理文檔以及代碼。目前Krabber已經可以下載了,可以嘗試著在Windows下用VS編譯一下,看看能不能行。另外可以運行的EXE也應該會快回上傳上來。
另外昨天開會的時候同學們表示,我們小組的博客好像不太容易看懂。這個沒辦法啦,沒有時間做網站和找主機,只能用博客充當在線內容編輯器了。大家在看我們的博客的時候請把它當成網站來看,相關的鏈接都在博客正文中黃色的標題下面,至于博客正文周邊的連接就無視好了……
Krabber在http://m.tkk7.com/senior/archive/2009/05/10/269916.html
(by : 雞叔 : senior, sakaekutitubasa@gmail.com)