在網上那多人問,如何抓取iframe或其他所有的信息,對象等,其實很簡單的,看了以下文章就明白了.
去這里下載jdic
https://jdic.dev.java.net/
我用的是0.94版,eclipse 3.x
下截后
將jdic.dll,IeEmbed.exe,jdic.jar,MozEmbed.exe,packager.jar,tray.dll考貝到你的工程lib目錄(在工程上建立lib目錄),然后設置以上.jar文件到編譯路徑.
建一個jFrame,加一個JPanel
以下為代碼片斷, 用以下代碼加載瀏覽器
WebBrowser webBrowser = new WebBrowser();
panel_name.add(webBrowser, BorderLayout.CENTER);
webBrowser .setURL(new URL(http://www.google.com));
webBrowser .addWebBrowserListener(new WebBrowserListener() {
public void downloadStarted(WebBrowserEvent event) {;}
public void downloadCompleted(WebBrowserEvent event) {;}
public void downloadProgress(WebBrowserEvent event) {;}
public void downloadError(WebBrowserEvent event) {;}
public void documentCompleted(WebBrowserEvent event) {
//在這里寫代碼
// 很COOL的功能,與腳本交互
StringBuffer jsBuff = new StringBuffer();
jsBuff.append(" var bodyhtml = document.body.innerHTML;"); //取當前頁的內容
String html = webBrowser .getContent(); //取當前頁的內容,這個不好用,在有iframe的網頁中不靈
jsBuff.append(" var hrefObj = document.getElementsByTagName('A');");
//....略,取頁面的N個內容
//好了,好多人都問,如何取得iframe的內容呢?jdic 的包沒有一個方法可以取得到的,看以上的腳本 var bodyhtml ,我們怎么取到它的值呢?如果取得到,那一切問題都可以解決.
String iframeScript= " var iframehtml = document.frames[0].body.innerHTML;"; //取得指定iframe的內容
//在這里,可以與腳本變量的值進行交互,完成我們想要的功能,確實很COOL
String iframeHtml = webBrowser .executeScript(iframeScript);
System.out.println(iframeHtml ); //出來的正是想要的,很簡單吧?但是不知道的話,想破頭也不明白
//說到這,其實大家已經明白,用jdic可以操縱絕大多數的網站,比如時下流行的web網游,想到什么了?對,寫一個腳本外掛就是這么簡單.
//快裝一個瀏覽器dom結構查看插件,操控在你手中
}
public void titleChange(WebBrowserEvent event) {;}
public void statusTextChange(WebBrowserEvent event) {;}
public void windowClose(WebBrowserEvent arg0) {
}
});
</script>