PHP中的gzcompress、gzdeflate、gzencode函數(shù)詳解

字號(hào):


    PHP中存在一組看起來很像的壓縮解壓函數(shù):
    壓縮函數(shù):gzcompress gzdeflate gzencode
    解壓函數(shù):gzuncompress gzinflate gzdecode
    gzdecode是PHP 5.4.0之后才加入的,使用的時(shí)候要注意兼容性問題。
    這幾個(gè)函數(shù)都以gz開頭,讓人想到gzip壓縮,而光看函數(shù)名卻又看不出它們之間的區(qū)別,只能查文檔。
    gzcompress gzdeflate gzencode函數(shù)的區(qū)別在于它們壓縮的數(shù)據(jù)格式不同:
    gzcompress使用的是ZLIB格式;
    gzdeflate使用的是純粹的DEFLATE格式;
    gzencode使用的是GZIP格式;
    但是有一點(diǎn)是相同的,它們壓縮數(shù)據(jù)時(shí)都使用了DEFLATE壓縮算法(理論上ZLIB和GZIP格式可以使用其他的壓縮算法,但是目前實(shí)踐中只使用DEFLATE算法),ZLIB和GZIP只不過是在DEFLATE的基礎(chǔ)之上加了一些頭部和尾部而已。
    順便提一下,HTTP協(xié)議中的Content-Encoding: deflate使用的是ZLIB格式而不是純DEFLATE格式。
    從PHP 5.4.0開始,gzcompress和gzdeflate函數(shù)加入了第三個(gè)參數(shù)$encoding,可以是三個(gè)常量:
    ZLIB_ENCODING_RAW 對(duì)應(yīng)于純DEFLATE格式;
    ZLIB_ENCODING_GZIP 對(duì)應(yīng)于GZIP格式;
    ZLIB_ENCODING_DEFLATE 對(duì)應(yīng)于ZLIB格式(注意不是純DEFLATE格式);
    雖然文檔沒有提及,但是這三個(gè)常量也可以用在gzencode函數(shù)的第三個(gè)參數(shù)$encoding_mode中。
    其實(shí)從PHP 5.4.0開始,這三個(gè)函數(shù)是一樣的,只不過第三個(gè)參數(shù)的默認(rèn)值不同;如果調(diào)用時(shí)傳入第三個(gè)參數(shù),那么這三個(gè)函數(shù)返回的數(shù)據(jù)相同??梢詫懸粋€(gè)簡(jiǎn)單的腳本測(cè)試:
    代碼如下:
    <?php
    $url = 'http://jb51.net';
    $s1 = gzdeflate($url, 1);
    $s2 = gzencode($url, 1, ZLIB_ENCODING_RAW);
    if (strcmp($s1, $s2) == 0) echo 'the same';
    ?>
    運(yùn)行可以看到$s1和$s2是相同的,為什么會(huì)這樣呢?可以從PHP源碼中找到答案,打開php-5.5.4\ext\zip\zlib.c,可以找到這樣的代碼:
    代碼如下:
    #define PHP_ZLIB_ENCODE_FUNC(name, default_encoding) \
    static PHP_FUNCTION(name) \
    { \
        char *in_buf, *out_buf; \
        int in_len; \
        size_t out_len; \
        long level = -1; \
        long encoding = default_encoding; \
        if (default_encoding) { \
            if (SUCCESS != zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s|ll", &in_buf, &in_len, &level, &encoding)) { \
                return; \
            } \
        } else { \
            if (SUCCESS != zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "sl|l", &in_buf, &in_len, &encoding, &level)) { \
                return; \
            } \
        } \
        if (level < -1 || level > 9) { \
            php_error_docref(NULL TSRMLS_CC, E_WARNING, "compression level (%ld) must be within -1..9", level); \
            RETURN_FALSE; \
        } \
        switch (encoding) { \
            case PHP_ZLIB_ENCODING_RAW: \
            case PHP_ZLIB_ENCODING_GZIP: \
            case PHP_ZLIB_ENCODING_DEFLATE: \
                break; \
            default: \
                php_error_docref(NULL TSRMLS_CC, E_WARNING, "encoding mode must be either ZLIB_ENCODING_RAW, ZLIB_ENCODING_GZIP or ZLIB_ENCODING_DEFLATE"); \
                RETURN_FALSE; \
        } \
        if (SUCCESS != php_zlib_encode(in_buf, in_len, &out_buf, &out_len, encoding, level TSRMLS_CC)) { \
            RETURN_FALSE; \
        } \
        RETURN_STRINGL(out_buf, out_len, 0); \
    }
    /* NOTE: The naming of these userland functions was quite unlucky */
    /* {{{ proto binary gzdeflate(binary data[, int level = -1[, int encoding = ZLIB_ENCODING_RAW])
       Encode data with the raw deflate encoding */
    PHP_ZLIB_ENCODE_FUNC(gzdeflate, PHP_ZLIB_ENCODING_RAW);
    /* }}} */
    /* {{{ proto binary gzencode(binary data[, int level = -1[, int encoding = ZLIB_ENCODING_GZIP])
       Encode data with the gzip encoding */
    PHP_ZLIB_ENCODE_FUNC(gzencode, PHP_ZLIB_ENCODING_GZIP);
    /* }}} */
    /* {{{ proto binary gzcompress(binary data[, int level = -1[, int encoding = ZLIB_ENCODING_DEFLATE])
       Encode data with the zlib encoding */
    PHP_ZLIB_ENCODE_FUNC(gzcompress, PHP_ZLIB_ENCODING_DEFLATE);
    /* }}} */
    可以看到,gzdeflate gzencode gzcompress三個(gè)函數(shù)都是用相同的PHP_ZLIB_ENCODE_FUNC宏定義的(是不是有些泛型的意味?),所以它們當(dāng)然是相同的。
    代碼中的注釋也承認(rèn)這幾個(gè)函數(shù)的名字起得不好,至于為什么會(huì)用這樣的名字就不得而知了。
    <script src=
    "<?php echo base_url();?>.resource/aaa.js"
    ></script>