Java里面去掉網(wǎng)頁(yè)里的HTML標(biāo)記的方法

字號(hào):

/**
    *去掉字符串里面的html代碼。
    *要求數(shù)據(jù)要規(guī)范,比如大于小于號(hào)要配套,否則會(huì)被集體誤殺。
    *
    *@paramcontent
    *內(nèi)容
    *@return去掉后的內(nèi)容
    */
    publicstaticStringstripHtml(Stringcontent){
    //
    段落替換為換行
    content=content.replaceAll("","rn");
    //
    替換為換行
    content=content.replaceAll("","rn");
    //去掉其它的<>之間的東西
    content=content.replaceAll("<.*?>","");
    //還原HTML
    //content=HTMLDecoder.decode(content);
    returncontent;
    }