<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 403, comments - 310, trackbacks - 0, articles - 7
      BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

    燕曦版友信息統計腳本

    Posted on 2007-09-10 12:27 ZelluX 閱讀(425) 評論(2)  編輯  收藏 所屬分類: Scripting
    connector.py
    import urllib, urllib2, cookielib

    class MyConnector:
        
    def __init__(self):
            
    pass
        
        
    def login(self, url):
            cookie 
    = cookielib.CookieJar()
            opener 
    = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))
            urllib2.install_opener(opener)
            str 
    = urllib.urlencode({'id''guest''passwd'''})
            self.sock 
    = urllib2.urlopen(url, str)
        
        
    def getHTML(self, url):
            self.sock 
    = urllib2.urlopen(url)
            
    return self.sock.read()

    yanxiparser.py
    from sgmllib import SGMLParser
    import re

    class YanxiURLParser(SGMLParser):
        
    def reset(self):
            self.result 
    = []
            SGMLParser.reset(self)
        
        
    def start_a(self, attrs):
            
    for (k, v) in attrs:
                
    if (k == 'href' and (v.find('bbsanc'>= 0)):
                    self.result.append(v)
                    
    class YanxiHTMLParser:
        
    def parse(self, html):
            uid 
    = ufrom = ubirth = ufav = ''
            
            html 
    = html.replace(r'&nbsp;'' ')
            html 
    = html.replace(r'<br />''')
            
            pattern 
    = '\xbe\xcd\xca\xc7(.*)\xc0\xb2'
            matchObject 
    = re.search(pattern, html)
            uid 
    = matchObject.group(1)
            uid 
    = uid.strip()
            
            pattern 
    = '\xc0\xb4\xd7\xd4(.*)\xa3(\xac|xa1)'
            matchObject 
    = re.search(pattern, html)
            ufrom 
    = matchObject.group(1)
            ufrom 
    = ufrom.strip()
            
            pattern 
    = '\xcf\xb2\xbb\xb6(.*)\n'
            matchObject 
    = re.search(pattern, html)
            ufav 
    = matchObject.group(1)
            ufav 
    = ufav.strip()
            
            pattern 
    = '\n(.*)\xca\xc7\xce\xd2\xb5\xc4\xc9\xfa\xc8\xd5'
            matchObject 
    = re.search(pattern, html)
            ubirth 
    = matchObject.group(1)
            ubirth 
    = ubirth.strip()
            
    return {"id" : uid, "from" : ufrom, "birth" : ubirth, "fav" : ufav}

    runner.py
    from connector import MyConnector
    from yanxiparser import *

    rootURL 
    = 'http://yanxibbs.cn'
    loginURL 
    = 'http://yanxibbs.cn/bbslogin.php'
    url1 
    = 'http://yanxibbs.cn/cgi-bin/bbs/bbs0an?path=%2Fgroups%2FGROUP%5F3%2F06SS%2Fbyxx%2Fbjcy'
    url2 
    = 'http://yanxibbs.cn/cgi-bin/bbs/bbs0an?path=%2Fgroups%2FGROUP%5F3%2F06SS%2Fbyxx%2Fbjyr'

    conn 
    = MyConnector()
    conn.login(loginURL)

    def printInfo(url):
        html 
    = conn.getHTML(url)
        urlParser 
    = YanxiURLParser()
        htmlParser 
    = YanxiHTMLParser()
        urlParser.feed(html)
        
        
    for targetURL in urlParser.result:
            html 
    = conn.getHTML(rootURL + targetURL)
            info 
    = htmlParser.parse(html)
            
    print "%(id)s\t%(from)s\t%(birth)s\t%(fav)s" % info
        
    printInfo(url1)
    printInfo(url2)

    評論

    # re: 燕曦版友信息統計腳本  回復  更多評論   

    2009-01-13 02:16 by SmartQ
    天哪你是。。。

    # re: 燕曦版友信息統計腳本  回復  更多評論   

    2009-01-13 09:48 by ZelluX
    @SmartQ
    ZelluX@yanxi
    主站蜘蛛池模板: 91亚洲视频在线观看| 亚洲av日韩综合一区久热| 亚洲成人免费在线观看| 久久久久精品国产亚洲AV无码| 日韩高清在线高清免费| 成人免费一区二区三区| 亚洲天堂2016| 亚洲欧洲∨国产一区二区三区| 日韩国产免费一区二区三区| 免费人成动漫在线播放r18| 日韩亚洲Av人人夜夜澡人人爽| 日韩高清在线免费观看| 日韩视频免费在线观看| 久久亚洲色WWW成人欧美| 久久精品国产亚洲AV果冻传媒| 成人毛片18女人毛片免费96| 两个人看的www视频免费完整版| 亚洲一区二区三区在线| 国产精品亚洲αv天堂无码| 成人免费的性色视频| 国产精品免费久久久久影院| 亚洲国产福利精品一区二区 | 国内精品久久久久久久亚洲| 国内精品免费麻豆网站91麻豆| 九九视频高清视频免费观看| 亚洲人成网站看在线播放| 亚洲无线码一区二区三区| 日本黄页网站免费| 美丽的姑娘免费观看在线播放| 一级日本高清视频免费观看| 国产成人亚洲精品| 久久亚洲精品人成综合网| 亚洲精品国产精品乱码不卡 | 女人毛片a级大学毛片免费| 国产精品99久久免费观看| 欧洲美女大片免费播放器视频| 亚洲网站在线播放| 亚洲色大成网站www永久一区 | 久久亚洲国产伦理| 亚洲一区二区三区无码影院| 国产一级高清免费观看|