ANSI编码方式转化为UTF-8方式

耗尽温柔 提交于 2019-12-18 03:43:20

说明:

记事本txt有四种编码方式,分别为:UTF-8、ANSI、Unicode和Unicode big endian,当进行写操作,创建的txt编码格式,与写入汉字的编码方式相同;如果写入的汉字是不同的编码方式,此时创建的txt中,会出现乱码,所以需要把汉字转化为同一编码方式。

本文主要介绍:把汉字编码方式,由ANSI方式转化为UTF-8方式:

一、ANSI转化为UTF-8程序:

  1. CString ToUTF8(const wchar_t* buffer, int len)  //返回类型为CString  
  2. {    
  3.     int size = ::WideCharToMultiByte(CP_UTF8, 0, buffer, len, NULL, 0, NULL,    
  4.             NULL);    
  5.     if (size == 0)    
  6.         return "";    
  7.     
  8.     std::string newbuffer;    
  9.     newbuffer.resize(size);    
  10.     ::WideCharToMultiByte(CP_UTF8, 0, buffer, len,    
  11.             const_cast<char*>(newbuffer.c_str()), size, NULL, NULL);    
  12.     
  13.     //如需返回string类型,直接 return newbuffer  
  14.       
  15.     TCHAR outstr[64]; //string 转化为CString返回  
  16.     CString strTemp;  
  17.     memset(outstr, '\0'sizeof(outstr));  
  18.     memcpy(outstr,newbuffer.c_str(),newbuffer.size());  
  19.     strTemp.Format("%s",outstr);  
  20.     return strTemp;   
  21. }    
CString ToUTF8(const wchar_t* buffer, int len)  //返回类型为CString
{  
    int size = ::WideCharToMultiByte(CP_UTF8, 0, buffer, len, NULL, 0, NULL,  
            NULL);  
    if (size == 0)  
        return "";  
  
    std::string newbuffer;  
    newbuffer.resize(size);  
    ::WideCharToMultiByte(CP_UTF8, 0, buffer, len,  
            const_cast<char*>(newbuffer.c_str()), size, NULL, NULL);  
  
    //如需返回string类型,直接 return newbuffer
    
    TCHAR outstr[64]; //string 转化为CString返回
    CString strTemp;
    memset(outstr, '\0', sizeof(outstr));
    memcpy(outstr,newbuffer.c_str(),newbuffer.size());
    strTemp.Format("%s",outstr);
    return strTemp; 
}  

二、函数调用形式

  1. wstring text =  L"汉字";   
  2. CString strTemp = ToUTF8(text.c_str(),text.size());  
wstring text =  L"汉字"; 
CString strTemp = ToUTF8(text.c_str(),text.size());





易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!