PHP編碼轉(zhuǎn)換函數(shù)mb_convert_encoding與iconv用法

字號:


    將一個短信接口代碼從apache遷移到nginx+php-fpm后,發(fā)現(xiàn)無法發(fā)出短信了,查看php日志,
    [25-Sep-2014 20:15:21] WARNING: [pool www] child 9617 said into stderr: “NOTICE: PHP message: PHP Fatal error: Call to undefined function mb_convert_encoding() in /data/htdocs/xx.php on line 13″
    發(fā)現(xiàn)函數(shù)mb_convert_encoding沒定義,看著像某個模塊沒裝,google了把,要裝個mbstring擴展,之前都是一下裝好多擴展(雖然不知道這個擴展是干啥的,按照網(wǎng)絡文檔來),現(xiàn)在是要應用需要哪個裝哪個,逼格略有提高(至少這樣能讓我知道哪個模塊是干啥的)。
    mb-convert-encoding
    string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding = mb_internal_encoding() ] )
    將 string 類型 str 的字符編碼從可選的 from_encoding 轉(zhuǎn)換到 to_encoding。
    官網(wǎng)文檔 http://php.net/manual/zh/function.mb-convert-encoding.php 需要安裝mbstring擴展庫,如果已經(jīng)編譯好的php可以這樣熱編譯下
    代碼如下:
    cd /tmp/php-5.3.28/ext/mbstring/
    usr/local/services/php/bin/phpize
    ./configure --with-php-config=/usr/local/services/php/bin/php-config
    make && make install
    vim /usr/local/services/php/etc/php.ini
    extension="/usr/local/services/php/lib/php/extensions/no-debug-non-zts-20090626/mbstring.so";
    iconv
    string iconv ( string in_charset, string out_charset, string str )
    iconv函數(shù)庫能夠完成各種字符集間的轉(zhuǎn)換
    注意:第二個參數(shù),除了可以指定要轉(zhuǎn)化到的編碼以外,還可以增加兩個后綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會自動將不能直接轉(zhuǎn)化的字符變成一個或多個近似的字符,//IGNORE 會忽略掉不能轉(zhuǎn)化的字符,而默認效果是從第一個非法字符截斷。
    Returns the converted string or FALSE on failu
    官網(wǎng)地址 http://php.net/manual/zh/book.iconv.php
    已經(jīng)安裝好php的,同樣也可以使用上面的方法安裝iconv模塊
    mb_convert_encoding例子
    mb_convert_encoding這個函數(shù)是用來轉(zhuǎn)換編碼的。英文一般不會存在編碼問題,只有中文數(shù)據(jù)才會有這個問題。比如你用Zend Studio或Editplus寫程序時,用的是gbk編碼,如果數(shù)據(jù)需要入數(shù)據(jù)庫,而數(shù)據(jù)庫的編碼為utf8時,這時就要把數(shù)據(jù)進行編碼轉(zhuǎn)換,不然進到數(shù)據(jù)庫就會變成亂碼
    做一個GBK To UTF-8
    代碼如下:
    <?php
    header(“content-Type: text/html; charset=Utf-8″);
    echo mb_convert_encoding(“???S我的友仔”, “UTF-8″, “GBK”);
    ?>
    再來個GB2312 To Big5
    代碼如下:
    <?php
    header(“content-Type: text/html; charset=big5″);
    echo mb_convert_encoding(“你是我的朋友”, “big5″, “GB2312″);
    ?>
    mb_strtolower() – 使字符串小寫
    mb_strtoupper() – 使字符串大寫
    strtolower() – 將字符串轉(zhuǎn)化為小寫
    strtoupper() – 將字符串轉(zhuǎn)化為大寫
    ucfirst() – 將字符串的首字母轉(zhuǎn)換為大寫
    ucwords() – 將字符串中每個單詞的首字母轉(zhuǎn)換為大寫
    iconv例子
    把gb2312置換成utf-8:
    代碼如下:
    $text=iconv("GB2312","UTF-8",$text);
    在用$text=iconv(“UTF-8″,”GB2312″,$text)過程中,如果遇到一些特別字符時,如:”—”,英文名中的”.”等等字符,轉(zhuǎn)換就斷掉了。這些字符后的文字都沒法繼續(xù)轉(zhuǎn)換了。
    針對這的問題,可以用如下代碼實現(xiàn):
    代碼如下:
    $text=iconv("UTF-8","GBK",$text);
    你沒有看錯,就這么簡單,不使用gb2312,而寫成GBK,就可以了。
    還有一種方法,第二個參數(shù),加上//IGNORE,忽略錯誤,如下:
    代碼如下:
    iconv("UTF-8","GB2312//IGNORE",$data);
    一般情況下用 iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉(zhuǎn)化后無法正常顯示時才用mb_convert_encoding 函數(shù)。
    代碼如下:
    $content = iconv("GBK", "UTF-8″, $content);
    $content = mb_convert_encoding($content, "UTF-8″, "GBK");