HTMLParser學(xué)習(xí)整理常用的解析代碼

字號(hào):

1.獲取指定URL地址下面的全部的<>標(biāo)簽名稱
    private void visitorFunction() {
    try {
    Parser parser = new Parser();
    parser.setURL("http://www.tianya.cn/publicforum/articleslist/0/no20.shtml"); parser.setEncoding(parser.getEncoding());
    NodeVisitor visitor = new NodeVisitor(){
    public void visitTag(Tag tag) {
    System.out.print("tag name is:"+tag.getTagName()+"\n class is:"+tag.getClass());
    }
    };
    parser.visitAllNodesWith(visitor);
    }catch (Exception e) {
    // TODO: handle exception
    }
    }
    2.獲取指定頁面的全部的鏈接地址即URL地址值
    private void visitorFunction() {
    try {
    Parser parser = new Parser();
    parser.setURL("http://www.tianya.cn/publicforum/articleslist/0/no20.shtml"); parser.setEncoding(parser.getEncoding());
    NodeVisitor visitor = new NodeVisitor(){
    public void visitTag(Tag tag) {
    System.out.print("tag name is:"+tag.getTagName()+"\n class is:"+tag.getClass());
    }