亚洲大成色www永久网址,337p日本欧洲亚洲大胆色噜噜 ,亚洲欧美日韩久久精品

Krabber 0.0.0.2版本發布

Krabber是用于抽取網頁中HTML信息的工具。最為重要的是，Krabber可以執行網頁中的JavaScript，并網頁在JavaScript執行后的，被修改的HTML返回回來，提供給Java程序調用，以便能夠更好的支持Web 2.0環境下的網頁信息抓取。

啊列啊列，經過了超長時間的掙扎，終于做好了第一個可以運行的版本。參與項目開發的同學從對C++與Java完全不了解到逐漸的熟悉并開始進步，實在是相當不容易啊，贊一個。我本科的時候要是有這個水平，沒準現在就牛X了。

比較慚愧的是，由于涉足開源領域的經驗不足，沒有很好的整理文檔以及代碼。目前Krabber已經可以下載了，可以嘗試著在Windows下用VS編譯一下，看看能不能行。另外可以運行的EXE也應該會快回上傳上來。

另外昨天開會的時候同學們表示，我們小組的博客好像不太容易看懂。這個沒辦法啦，沒有時間做網站和找主機，只能用博客充當在線內容編輯器了。大家在看我們的博客的時候請把它當成網站來看，相關的鏈接都在博客正文中黃色的標題下面，至于博客正文周邊的連接就無視好了……

Krabber在http://m.tkk7.com/senior/archive/2009/05/10/269916.html

(by : 雞叔 : senior, sakaekutitubasa@gmail.com)

posted on 2009-05-11 08:14 Senior 閱讀(1745) 評論(2) 編輯收藏所屬分類: Misc

Feedback

# re: Krabber 0.0.0.2版本發布[未登錄] 2009-05-12 20:58 劉明

以前公司讓做過個類似的東西,弄了一星期放棄了...

你是用C++調用的IE吧?那還用Java干什么?只要能調用IE剩下的事情應該就比較好辦,我就是對Window下的IE調用和C++不太熟,比較失敗,哈哈... 回復更多評論

# re: Krabber 0.0.0.2版本發布 2009-05-13 05:33 Senior

@劉明

謝謝關心我們的項目。

Krabber只是整個kVitrail項目的網頁抽取部分。由于kVitrail的其他部分是用Java做的，并且實驗室幾乎所有的其他項目都是用Java寫的，因此為了保證這個部分能夠為其他項目提供服務才做出這種奇怪的決定的。

主要的原因還是我們能力不足，其實Symphony既然可以把IE嵌入到應用中，那么直接通過Java調用IE應該也是可以的吧。只是目前我們還沒有學習到那么深入的部分，因此暫時只能采用這種比較笨的方法了。

另外我只負責項目的管理，Krabber的具體的技術是pinlin同學負責研究和實現的。如果需要您可以和他聯系。pinlin168@tom.com

(by: 雞叔 : senior, sakaekutitubasa@gmail.com)
回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: AJAX網頁抓取工具 Krabber 0.2.9正式發布支持AJAX的網頁抓取工具的原型系統 Krabber 0.0.0.2版本發布 senior

Senior

Krabber 0.0.0.2版本發布

Feedback

# re: Krabber 0.0.0.2版本發布[未登錄] 2009-05-12 20:58 劉明

# re: Krabber 0.0.0.2版本發布 2009-05-13 05:33 Senior

My Links

Blog Stats

常用鏈接

留言簿(1)

隨筆分類(9)

隨筆檔案(10)

最新隨筆

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜