水蜜桃亚洲一二三四在线,亚洲国产精品一区二区第四页,成a人片亚洲日本久久

Java抓取網頁內容

用Java代碼來抓取網頁內容有很多種方法，可以直接用網絡編程的知識鏈接到網站上用輸入輸出流的方式來讀取內容，然后用正則表達是來解析流文件，得到自己想要的內容。不過有人已經將這種內容封裝好了叫HTMLParser這個東西提供了很多的的方法可以使用，具體的網上有很多的例子他有三種方式來解析這個網頁。下一節來說明他們之間的使用方式。

貼一個用URL的方式。這個代碼雖然能出結果，不過好像有問題，還望高人指點！！

package com.xjsx.gethtml;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;

public class GetHTML {

    /**
     * @param args
     */
    public static void main(String[] args) {

        try {

            URL url = new URL("http://www.baidu.com");

            URLConnection urlConnection = url.openConnection();

            InputStream inputStream = urlConnection.getInputStream();

            // InputStream inputStream = url.openStream();

            BufferedReader reader = new BufferedReader(new InputStreamReader(
                    inputStream));

            String date;

            while ((date = reader.readLine()) != null) {
                System.out.println(date);
            }

        } catch (MalformedURLException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }

}

發表于 2010-12-21 11:48 大道至簡閱讀(2421) 評論(1) 編輯收藏

評論

# re: Java抓取網頁內容

java抓取網頁相關demo源代碼下載地址：http://zuidaima.com/share/k%E6%8A%93%E5%8F%96%E7%BD%91%E9%A1%B5-p1-s1.htm

zuidaima 評論于 2014-11-25 15:36 回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理

Java抓取網頁內容

導航

統計

常用鏈接

留言簿

隨筆檔案

文章分類

文章檔案

相冊

收藏夾

搜索

最新評論

閱讀排行榜

評論排行榜