<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    march alex's blog
    hello,I am march alex
    posts - 52,comments - 7,trackbacks - 0
    上百度搜東西的時候,右邊總有一些推薦的東西很吸引我們的注意,因為那是百度的推薦系統給我推薦的我們感興趣的東西。
    那這些推薦的內容也在源代碼里面出現了。
    所以采用類似分析網頁源代碼的方法我們能夠把里面的東西全都挖下來。
    比如說我在百度搜索了“一句話木馬”,百度就會跳到一個固定的鏈接:
    https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E4%B8%80%E5%8F%A5%E8%AF%9D%E6%9C%A8%E9%A9%AC&rsv_pq=fcb3de5b00004128&rsv_t=6f62cGPSB5k0xYiyhhPSjjDXemE9KEBVk0diG3YR6PnVzpq1vmoq%2FDdFD8E&rsv_enter=1&rsv_n=2&rsv_sug3=1
    好長是不?
    其實我們可以將這個url縮短一下,變成:
    http://www.baidu.com/s?wd=%E4%B8%80%E5%8F%A5%E8%AF%9D%E6%9C%A8%E9%A9%AC
    等同于
    http://www.baidu.com/s?wd=一句話木馬
    網頁的右側出現了三個欄:“相關病毒”,“相關人物”和“其他人還搜”,直覺告訴我第一個是聯系比較緊密的。
    所以我的目的就是變成找出第一個欄(不光是這里)的所有推薦內容。
    分析網頁會發現每個欄目最前面都會有一個標志性的字符串:"<span title="
    而每個欄目里面的每個內容前面也會有一個標志性的字符串:"rsv_re_ename"
    據此我寫了一個分析的FinderRelate類,其中的getRelate(String word)用于獲得關鍵詞word對應的推薦的內容。
    import java.io.BufferedReader;
    import java.io.InputStreamReader;
    import java.net.HttpURLConnection;
    import java.net.URL;
    import java.util.StringTokenizer;


    public class FindRelate {
        
        public static String[] getRelate(String word) throws Exception {
            String urlString = "http://www.baidu.com/s?wd=" + word;
            String ans = "";
            String s_span = "<span title=";
            int len_span = s_span.length();
            String s_rsv = "rsv_re_ename";
            int len_rsv = s_rsv.length();
            
            URL url = new URL(urlString);
            HttpURLConnection urlConnection = (HttpURLConnection) url.openConnection();
            BufferedReader reader = new BufferedReader(new InputStreamReader(urlConnection.getInputStream(), "utf-8"));
            String line;
            boolean ok = false;
            while ((line = reader.readLine()) != null){
                int len = line.length();
                 for(int i=0;i+len_span<=len;i++) {
                     if(line.substring(i, i+len_span).equals(s_span)) {
                         if(ok == false) ok = true;
                         else {
                             StringTokenizer st = new StringTokenizer(ans);
                             int n = st.countTokens();
                             String[] res = new String[n];
                             for(int j=0;j<n;j++) {
                                 res[j] = st.nextToken();
                             }
                             return res;
                         }
                     }
                 }
                 if(ok == falsecontinue;
                 for(int i=0;i+len_rsv<=len;i++) {
                     if(line.substring(i, i+len_rsv).equals(s_rsv)) {
                         for(int j=i+len_rsv+3;j<len && line.charAt(j)!='\'';j++) {
                             ans += line.charAt(j);
                         }
                         ans += " ";
                     }
                 }
            }
            String[] null_res = new String[1];
            null_res[0] = null;
            return null_res;
        }
        public static void main(String[] args) throws Exception {
            String[] res = getRelate("一句話木馬");
            int len = res.length;
            for(int i=0;i<len;i++)
                System.out.println(res[i]);
        }
    }
    其輸出結果如下:
    廣外女生木馬
    qq尾巴
    熊貓燒香
    歡樂時光病毒
    灰鴿子
    大小姐木馬
    盜號
    機器狗
    盜號木馬
    冰河木馬
    沖擊波病毒
    莫里斯蠕蟲
    asp木馬
    cih病毒
    火焰病毒
    posted on 2015-03-07 00:07 marchalex 閱讀(1556) 評論(0)  編輯  收藏 所屬分類: java小程序
    主站蜘蛛池模板: 四色在线精品免费观看| 人碰人碰人成人免费视频| 亚洲丁香色婷婷综合欲色啪| 久久九九亚洲精品| 337p欧洲亚洲大胆艺术| 亚洲人成网站免费播放| 精品多毛少妇人妻AV免费久久| 最近免费mv在线观看动漫| 无码人妻一区二区三区免费| 国产成人免费a在线视频app| 国产亚洲精品资源在线26u| 中文字幕乱码亚洲精品一区| 国产一级一毛免费黄片| 卡1卡2卡3卡4卡5免费视频 | 毛片免费视频在线观看| 成年女人男人免费视频播放| 中文字幕在线观看亚洲日韩| 国产免费牲交视频| 在线a亚洲老鸭窝天堂av高清| 另类免费视频一区二区在线观看| 好爽好紧好大的免费视频国产 | 亚洲免费视频播放| 久久久WWW免费人成精品| 国产亚洲精午夜久久久久久| 亚洲国产精品人久久电影| 国产VA免费精品高清在线| 成人免费午夜视频| 有色视频在线观看免费高清在线直播| 中文字幕亚洲图片| 一级女人18片毛片免费视频| 国产区卡一卡二卡三乱码免费| 一级免费黄色大片| 久久精品九九亚洲精品| A级毛片高清免费视频在线播放| 91精品国产亚洲爽啪在线影院| 免费a级毛片高清视频不卡| 猫咪免费观看人成网站在线| 成年女人毛片免费播放人| 自拍偷自拍亚洲精品偷一| 国内精品乱码卡1卡2卡3免费| 亚洲黄色中文字幕|