C语言-处理中文字符串注意事项

微笑、不失礼 提交于 2019-12-04 19:01:52

Note1: 由于一个汉字占2个字节(Byte),而一个英文字母占1个字节(Byte),所以用char str[LENGTH] 定义汉字字符串的时候,一定要注意LENGTH的取值,以保证有足够的空间存储汉字字符串。

例如:当汉字字符串为 “诸葛亮是个好孩子”(共8个汉字)时

LENGTH的值最小应该为 2*8+1=17:


即:char str[17];

最后的那个+1是为了存储‘\0’,字符串的结尾符号


Note2: 汉字所占的字节数依赖于操作系统

WIN7-32bit: 一个汉字占2个字节,标点符号同样占2个字节,数字占1个字节,字符串结束标志‘\0’占一个字节。

Linux(CentOS-32bit: 一个汉字占3个字节,逗号和句号同样占3个字节,‘~’占一个字节,数字占1个字节,字符串结束标志‘\0’占一个字节。


易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!