<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 403, comments - 310, trackbacks - 0, articles - 7
      BlogJava :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

    燕曦版友信息統(tǒng)計(jì)腳本

    Posted on 2007-09-10 12:27 ZelluX 閱讀(425) 評(píng)論(2)  編輯  收藏 所屬分類: Scripting
    connector.py
    import urllib, urllib2, cookielib

    class MyConnector:
        
    def __init__(self):
            
    pass
        
        
    def login(self, url):
            cookie 
    = cookielib.CookieJar()
            opener 
    = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))
            urllib2.install_opener(opener)
            str 
    = urllib.urlencode({'id''guest''passwd'''})
            self.sock 
    = urllib2.urlopen(url, str)
        
        
    def getHTML(self, url):
            self.sock 
    = urllib2.urlopen(url)
            
    return self.sock.read()

    yanxiparser.py
    from sgmllib import SGMLParser
    import re

    class YanxiURLParser(SGMLParser):
        
    def reset(self):
            self.result 
    = []
            SGMLParser.reset(self)
        
        
    def start_a(self, attrs):
            
    for (k, v) in attrs:
                
    if (k == 'href' and (v.find('bbsanc'>= 0)):
                    self.result.append(v)
                    
    class YanxiHTMLParser:
        
    def parse(self, html):
            uid 
    = ufrom = ubirth = ufav = ''
            
            html 
    = html.replace(r'&nbsp;'' ')
            html 
    = html.replace(r'<br />''')
            
            pattern 
    = '\xbe\xcd\xca\xc7(.*)\xc0\xb2'
            matchObject 
    = re.search(pattern, html)
            uid 
    = matchObject.group(1)
            uid 
    = uid.strip()
            
            pattern 
    = '\xc0\xb4\xd7\xd4(.*)\xa3(\xac|xa1)'
            matchObject 
    = re.search(pattern, html)
            ufrom 
    = matchObject.group(1)
            ufrom 
    = ufrom.strip()
            
            pattern 
    = '\xcf\xb2\xbb\xb6(.*)\n'
            matchObject 
    = re.search(pattern, html)
            ufav 
    = matchObject.group(1)
            ufav 
    = ufav.strip()
            
            pattern 
    = '\n(.*)\xca\xc7\xce\xd2\xb5\xc4\xc9\xfa\xc8\xd5'
            matchObject 
    = re.search(pattern, html)
            ubirth 
    = matchObject.group(1)
            ubirth 
    = ubirth.strip()
            
    return {"id" : uid, "from" : ufrom, "birth" : ubirth, "fav" : ufav}

    runner.py
    from connector import MyConnector
    from yanxiparser import *

    rootURL 
    = 'http://yanxibbs.cn'
    loginURL 
    = 'http://yanxibbs.cn/bbslogin.php'
    url1 
    = 'http://yanxibbs.cn/cgi-bin/bbs/bbs0an?path=%2Fgroups%2FGROUP%5F3%2F06SS%2Fbyxx%2Fbjcy'
    url2 
    = 'http://yanxibbs.cn/cgi-bin/bbs/bbs0an?path=%2Fgroups%2FGROUP%5F3%2F06SS%2Fbyxx%2Fbjyr'

    conn 
    = MyConnector()
    conn.login(loginURL)

    def printInfo(url):
        html 
    = conn.getHTML(url)
        urlParser 
    = YanxiURLParser()
        htmlParser 
    = YanxiHTMLParser()
        urlParser.feed(html)
        
        
    for targetURL in urlParser.result:
            html 
    = conn.getHTML(rootURL + targetURL)
            info 
    = htmlParser.parse(html)
            
    print "%(id)s\t%(from)s\t%(birth)s\t%(fav)s" % info
        
    printInfo(url1)
    printInfo(url2)

    評(píng)論

    # re: 燕曦版友信息統(tǒng)計(jì)腳本  回復(fù)  更多評(píng)論   

    2009-01-13 02:16 by SmartQ
    天哪你是。。。

    # re: 燕曦版友信息統(tǒng)計(jì)腳本  回復(fù)  更多評(píng)論   

    2009-01-13 09:48 by ZelluX
    @SmartQ
    ZelluX@yanxi
    主站蜘蛛池模板: 亚洲va在线va天堂成人| 亚洲啪AV永久无码精品放毛片| 亚洲香蕉免费有线视频| 91在线亚洲综合在线| 亚洲精品亚洲人成在线观看下载| japanese色国产在线看免费| 亚洲天天在线日亚洲洲精| 成全高清视频免费观看| 国产在线国偷精品免费看| 亚洲一区二区三区深夜天堂| 国产精品xxxx国产喷水亚洲国产精品无码久久一区 | 久久伊人亚洲AV无码网站| 中字幕视频在线永久在线观看免费 | 久久这里只精品99re免费| 亚洲国产精品无码久久九九大片| 亚洲色精品vr一区二区三区 | 亚洲麻豆精品国偷自产在线91| 99热这里只有精品免费播放| 久久综合亚洲色hezyo| 亚洲成a人片77777kkkk| 国产免费观看黄AV片| 中文字幕在线免费| 国产成人亚洲精品无码AV大片 | 全黄大全大色全免费大片| 亚洲欧洲国产综合AV无码久久| 久久亚洲国产午夜精品理论片| 国产精品酒店视频免费看| 久久久久久一品道精品免费看| 免费中文字幕视频| 亚洲国产乱码最新视频| 亚洲人成电影福利在线播放| 亚洲人成网站在线观看青青| 四虎成人免费大片在线| 亚欧在线精品免费观看一区| 国产福利免费视频| 免费精品视频在线| 亚洲AV成人无码久久WWW| 亚洲一级毛片免费在线观看| 亚洲国产成人久久综合碰碰动漫3d| 免费在线观看理论片| 成年女人毛片免费视频|