用C語言實(shí)現(xiàn)常見的三種中文內(nèi)碼轉(zhuǎn)換

字號:

常見的中文內(nèi)碼一般有GB2312(簡體中文),GBK和臺灣那邊用的BIG5(繁體中文),有時候看一些臺灣編程論壇里的資料,都是亂碼,如果在IE中瀏覽,則要求安裝繁體字庫的支持。網(wǎng)上也有很多中文內(nèi)碼的轉(zhuǎn)換工具,什么專家,大師,巨匠之類所有光輝燦爛的名字都被使用了,但是在自己的程序中集成這些功能豈不是更好。以前曾廣泛流傳過使用碼表來轉(zhuǎn)換中文內(nèi)碼的Code,但畢竟不完美,而且還要攜帶或內(nèi)置一個巨大的表,浪費(fèi)資源。Windows中提供了MultiByteToWideChar和WideCharToMultiByte兩兄弟函數(shù),足可以搞定這些功能了。
    以下四個函數(shù)分別實(shí)現(xiàn):
    大五碼轉(zhuǎn)GBK碼/GBK轉(zhuǎn)大五碼
    GB2312碼轉(zhuǎn)GBK碼/GBK碼轉(zhuǎn)GB2312碼
    于是有人要問了,為什么沒有GB2312轉(zhuǎn)BIG5和BIG5轉(zhuǎn)GB2312呢,我們有GBK,可以做一下中轉(zhuǎn)啊??梢詫B2312轉(zhuǎn)成GBK,再將GBK轉(zhuǎn)成BIG5,反之亦然。如果你嫌麻煩,可以自己寫一個GB2BIG5/BIG52GB。
    //---------------------------------------------------------------------------
    // 大五碼轉(zhuǎn)GBK碼:
    // い地チ㎝瓣 --> 中華人民共和國
    void __fastcall BIG52GBK(char *szBuf)
    {
     if(!strcmp(szBuf, ""))
     return;
     int nStrLen = strlen(szBuf);
     wchar_t *pws = new wchar_t[nStrLen + 1];
     try
     {
     int nReturn = MultiByteToWideChar(950, 0, szBuf, nStrLen, pws, nStrLen + 1);
     BOOL bValue = false;
     nReturn = WideCharToMultiByte(936, 0, pws, nReturn, szBuf, nStrLen + 1, "?", &bValue);
     szBuf[nReturn] = 0;
     }
     __finally
     {
     delete[] pws;
     }
    }
    //---------------------------------------------------------------------------
    // GBK轉(zhuǎn)大五碼
    // 中華人民共和國 --> い地チ㎝瓣
    void __fastcall GBK2BIG5(char *szBuf)
    {
     if(!strcmp(szBuf, ""))
     return ;
     int nStrLen = strlen(szBuf);
     wchar_t *pws = new wchar_t[nStrLen + 1];
     try
     {
     MultiByteToWideChar(936, 0, szBuf, nStrLen, pws, nStrLen + 1);
     BOOL bValue = false;
     WideCharToMultiByte(950, 0, pws, nStrLen, szBuf, nStrLen + 1, "?", &bValue);
     szBuf[nStrLen] = 0;
     }
     __finally
     {
     delete[] pws;
     }
    }