首頁(yè)
教育培訓(xùn)
學(xué)術(shù)思想
書庫(kù)與文庫(kù)
文化與生活
學(xué)習(xí)交流
學(xué)習(xí)工具
APP下載
隨便看看

用php代替js玩轉(zhuǎn)dom的思路及示例代碼

字號(hào)：小 中 大

事情的起源比較簡(jiǎn)單，我需要把一個(gè)導(dǎo)航頁(yè)的數(shù)據(jù)整理好寫入數(shù)據(jù)庫(kù)。一個(gè)比較直觀的方法是對(duì)html文件進(jìn)行分析，通用的方法是用php的正則表達(dá)式來匹配。但是這樣做開發(fā)和維護(hù)都很困難，代碼可讀性非常差。
    導(dǎo)航頁(yè)的數(shù)據(jù)都是規(guī)則的排列在dom樹當(dāng)中的，用js可以用幾個(gè)循環(huán)輕松的對(duì)其進(jìn)行操作，而且js需要依賴瀏覽器，操作數(shù)據(jù)庫(kù)很困難。其實(shí)php就有現(xiàn)成的類庫(kù)對(duì)dom樹種的節(jié)點(diǎn)進(jìn)行增刪改查操作，在此做一些筆記。
    這里涉及到2個(gè)類 domdocument 和 domxpath。
    其實(shí)思路比較明確，就是通過domdocument將一個(gè)html file轉(zhuǎn)換成dom樹的數(shù)據(jù)結(jié)構(gòu)，再用domxpath的實(shí)例去搜索這個(gè)dom樹，拿到想要特定節(jié)點(diǎn)，接下來就可以對(duì)當(dāng)前節(jié)點(diǎn)的子樹進(jìn)行遍歷，得到想要的結(jié)果。
    在當(dāng)前目錄下有一個(gè)這樣一個(gè)導(dǎo)航的html文件 ./hao.html
    現(xiàn)在需要得到所有<a>標(biāo)簽的中文內(nèi)容，php代碼如下：

代碼如下:

    <?php
    //將html/xml文件轉(zhuǎn)換成dom樹
    $dom = new domdocument();
    $dom->loadhtmlfile(hao.html);
    //得到所有class為fix的dl標(biāo)簽
    // example 1: for everything with an id
    //$elements = $xpath->query(//*[@id]);
    // example 2: for node data in a selected id
    //$elements = $xpath->query(/html/body/div[@id='yourtagidhere']);
    // example 3: same as above with wildcard
    //$elements = $xpath->query(*/div[@id='yourtagidhere']);
    $xpath = new domxpath($dom);
    $dls = $xpath->query('//dl[@class=fix]');
    foreach ($dls as $dl) {
    $spans = $dl->childnodes;
    foreach ($spans as $span) {
    echo trim($span->textcontent).\t;
    }
    echo \n;
    }
    ?>

    輸出結(jié)果如下：
    注意：值得注意的一點(diǎn)是domdocument的默認(rèn)編碼方式是latin，所以在處理utf編碼的中文的時(shí)候，需要在<head>后面緊跟著填入

代碼如下:

在其他位置，或者是只寫上<meta content=charset=utf-8>都是不識(shí)別的哦

感谢您访问我们的网站，您可能还对以下资源感兴趣：

国产成人无码手机在线视频_亚洲另类欧美小说图片区_成人在线手机版视频视频_亚洲另类欧美日本

用php代替js玩轉(zhuǎn)dom的思路及示例代碼

字號(hào)： 小 中 大

字號(hào)：小中大