c++字符集之间转换(UTF-8,UNICODE,Gb2312)
UTF-8: 3字节一个字符 UNICODE: 2字节一个字符 GB2312: 1字节一个字符 例子: “你”字的UTF-8编码: E4 BD A0 11100100 10111101 10100000 “你”的Unicode编码: 4F 60 01001111 01100000 按照UTF-8的编码规则,分解如下:xxxx0100 xx111101 xx100000,把除了x之外的数字拼接在一起,就变成“你”的Unicode编码了。 注意UTF-8的最前面3个1,表示整个UTF-8串是由3个字节构成的。 经过UTF-8编码之后,再也不会出现敏感字符了,因为最高位始终为1。 类定义 class CChineseCode{ public: static void UTF_8ToUnicode(wchar_t* pOut,char *pText); // 把UTF-8转换成Unicode static void UnicodeToUTF_8(char* pOut,wchar_t* pText); //Unicode 转换成UTF-8 static void UnicodeToGB2312(char* pOut,wchar_t uData); // 把Unicode 转换成 GB2312 static void Gb2312ToUnicode(wchar