<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 33,  comments - 70,  trackbacks - 0
    HTMLParser 1.6

    /*
    html : html內(nèi)容
    identifier: 搜索標(biāo)識(shí)
    */

    private?Object[]?extractText(String?html,?String?identifier)
    ????????????
    throws?Exception?{
    ????????List
    <String>?resultTextList?=?new?ArrayList<String>();

    ????????Parser?parser?
    =?new?Parser();
    ????????parser.setInputHTML(html);

    ????????NodeFilter?filter?
    =?new?HasAttributeFilter("class",?identifier);
    ?/* NodeFilter?filter 就是要解析的過(guò)濾器,實(shí)現(xiàn)有好多種,我采用的屬性過(guò)濾,其他more api*/

    ????????NodeList?nodeList?
    =?parser.extractAllNodesThatMatch(filter);
    /* extractAllNodesThatAre(class)已經(jīng)不被推薦使用,在1.6版本中,我感到更加體形了靈活性.更好的適用了自定義的tag */
    ????????
    if?(nodeList?==?null)
    ????????????
    return?null;
    ????????
    if(nodeList.size()?==?0)
    ????????????
    return?null;

    ????????
    //?System.out.println("start?==============?,size?=?"
    ????????
    //?+?nodeList.size());
    ????????Node[]?nodes?=?nodeList.toNodeArray();
    ????????String?line?
    =?"";
    ????????
    for?(int?i?=?0;?i?<?nodes.length;?i++)?{
    ????????????Node?node?
    =?nodes[i];???/*得到所以符合的節(jié)點(diǎn),類型化做對(duì)應(yīng)的標(biāo)簽類*/
    ????????
    if?(node?instanceof?Span)?{
    ????????????????Span?spanTag?
    =?(Span)?node;
    ????????????????line?
    =?spanTag.toPlainTextString();
    ????????????}
    ?else?if?(node?instanceof?TableColumn)?{
    ????????????????TableColumn?tableTag?
    =?(TableColumn)?node;
    ????????????????line?
    =?tableTag.toPlainTextString();
    ????????????}
    ?else?if?(node?instanceof?Div)?{
    ????????????????Div?divTag?
    =?(Div)?node;
    ????????????????line?
    =?divTag.toPlainTextString();
    ????????????}

    ????????????
    if?(StringUtil.isTrimEmpty(line)){
    ????????????????
    continue;
    ????????????}
    else{
    ????????????????resultTextList.add(line);
    ????????????}

    ????????????
    ????????}

    ????????
    return?resultTextList.toArray();
    ????}


    StringUtil 常用類
    /**
    ?????*?去掉左右空格后字符串是否為空
    ?????
    */

    ????
    public?static?boolean?isTrimEmpty(String?astr)
    ????
    {
    ????????
    if?((null?==?astr)?||?(astr.length()?==?0))
    ????????
    {
    ????????????
    return?true;
    ????????}

    ????????
    if?(isBlank(astr.trim()))
    ????????
    {
    ????????????
    return?true;
    ????????}

    ????????
    return?false;
    ????}


    ????
    /**
    ?????*?字符串是否為空:null或者長(zhǎng)度為0.
    ?????
    */

    ????
    public?static?boolean?isBlank(String?astr)
    ????
    {
    ????????
    if?((null?==?astr)?||?(astr.length()?==?0))
    ????????
    {
    ????????????
    return?true;
    ????????}

    ????????
    else
    ????????
    {
    ????????????
    return?false;
    ????????}

    ????}

    FeedBack:
    # re: HTMLParser屬性解析
    2006-06-02 21:45 | libby
    想請(qǐng)教作者,可能是由于html的語(yǔ)法不規(guī)范所至,我用Htmlparser分析html文檔出現(xiàn)錯(cuò)誤,像普通的Html文檔其結(jié)束標(biāo)記如果存在重復(fù),一般不予理睬,可是在用Htmlparser其會(huì)進(jìn)行處理,往往會(huì)引起一些顯示問(wèn)題.
    我想利用htmlparser分析html頁(yè)面,生成一棵樹(shù),感覺(jué)不應(yīng)該出現(xiàn)的錯(cuò)誤卻出現(xiàn)了.
    作者可否跟俺取得聯(lián)系,我想同你討論一下.俺郵箱是:libby22@sohu.com或者M(jìn)SN:libby22@hotmail.com

    著急,謝謝!  回復(fù)  更多評(píng)論
      
    <2006年5月>
    30123456
    78910111213
    14151617181920
    21222324252627
    28293031123
    45678910

    常用鏈接

    隨筆分類

    隨筆檔案

    文章檔案

    相冊(cè)

    連接

    最新隨筆

    搜索

    •  

    最新評(píng)論

    閱讀排行榜

    評(píng)論排行榜

    主站蜘蛛池模板: 100部毛片免费全部播放完整| 亚洲A∨午夜成人片精品网站| 亚洲av中文无码乱人伦在线播放 | 亚洲欭美日韩颜射在线二| 337P日本欧洲亚洲大胆艺术图 | 福利免费在线观看| 久久亚洲欧洲国产综合| 丰满少妇作爱视频免费观看| 大胆亚洲人体视频| 久草免费福利在线| 亚洲国产精品无码久久久秋霞2| A级毛片高清免费视频在线播放| 亚洲av无码不卡一区二区三区| 无码成A毛片免费| 亚洲av片不卡无码久久| 在线a毛片免费视频观看| 国产精品观看在线亚洲人成网| 亚洲日韩在线观看免费视频| 99在线免费观看| 亚洲色偷偷av男人的天堂| 毛片免费vip会员在线看| 国产精品亚洲精品久久精品| 久久99亚洲综合精品首页| 国产精品免费一区二区三区四区 | 亚洲国产综合AV在线观看| 免费又黄又爽又猛的毛片| 色在线亚洲视频www| 国产在线a不卡免费视频| 国产真人无码作爱免费视频| 亚洲精品高清国产麻豆专区| 波多野结衣免费一区视频| 亚洲免费在线视频播放| 国产大片免费观看中文字幕| 免费看少妇高潮成人片| 亚洲丰满熟女一区二区v| 免费一级e一片在线播放| **aaaaa毛片免费同男同女| 色窝窝亚洲AV网在线观看| 亚洲av午夜成人片精品网站| 成人毛片18女人毛片免费96| 一级毛片a女人刺激视频免费|