gbk

Python 编码:unicode、uft-8、gbk

流过昼夜 提交于 2020-01-18 06:05:34
Python 编码 三种编码之间可以通过unicode进行转化,内部默认存储为unicode格式 unicode为中介 一般使用uft-8 gbk一般显示为乱码 unicode可以显示在hive表中 参考文献: https://blog.csdn.net/chixujohnny/article/details/51782826 来源: CSDN 作者: sunflower_sara 链接: https://blog.csdn.net/sunflower_sara/article/details/104010030

Mysql之字符集

六月ゝ 毕业季﹏ 提交于 2020-01-17 06:55:23
Mysql 常见数据类型 INT类型 TINTINT 1字节(256) 2的8次 INT 4字节(4294967296)2的32次 BIGINT 8字节 DATE类型 DATE 3字节 TIMESTAMP 4字节 STRING类型 CHAR(M) M字节 1<=M<=255 (左边对齐) VARCHAR(M) L+1字节 L<=M 1<=M<=255 BLOB,TEXT L+2字节 L<2^8 Mysql数据库字符集知识   字符集就是一套文字符号及其编码、比较规则的集合   Mysql数据库字符集包括字符集(character)和校对规则(collation)两个概念。字符集定义mysql数据字符串的存储方式,校对规则定义比较字符串的方式。 mysql 数据库常见字符集 一个汉字长度 说明 GBK 2 不是国际标准,对中文支持较好(需支持中文,数据量大,性能要求高) UTF-8 3 扩展B区以后的汉字占四个字节中英混合环境,用的最多,没特别需求,建议此种 latin1 1 yum安装默认字符集 utf8mb4 4 UTF-8 Unicode,移动互联网 企业场景创建什么字符集的数据库呢? 1、根据开发程序确定的字符集(建议utf8) 2、在编译时候指定字符集 3、建库的时候默认创建即可mysql> show char set; 查看字符集设置情况 1、查看当前数据库字符集设置

解决Tomcat控制台乱码问题

此生再无相见时 提交于 2020-01-17 05:14:06
解决Tomcat控制台乱码问题 问题原因:编码不一致,Tomcat启动后默认编码UTF-8,而Windows的默认编码是GBK。所以只需配置启动tomcat后为GBK编码即可。 做法:找到路径 \apache-tomcat-xxx\conf\ 下的logging.properties文件,添加(或修改)语句为:java.util.logging.ConsoleHandler.encoding = GBK 然后重启tomcat就ok了。 来源: CSDN 作者: XiaoAYing 链接: https://blog.csdn.net/XiaoAYing/article/details/103818148

写入文件中遇到 UnicodeEncodeError: ‘gbk’ codec can’t encode character 错误的解决办法

倖福魔咒の 提交于 2020-01-17 04:38:05
之前也遇到了,在此做一个笔记,引用博主http://blog.csdn.net/vito21/article/details/53490435 在写入TXT文件时,某些页面总是报 UnicodeEncodeError: ‘gbk’ codec can’t encode character错误,网上找了半天也没找到解决办法。 后来终于找到了解决办法,十分简单:在 f = open('英语练习.txt','a+',encoding='utf-8') 里加上encoding='utf-8'这个参数就行了。 出错的原因是网页及python的编码都是utf-8,在写进txt时Windows默认转码成gbk,遇到某些gbk不支持的字符就会报错。在打开文件时就声明编码方式为utf-8就能避免这个错误。 来源: https://www.cnblogs.com/wangcongsuibi/p/7941294.html

Qt Creator 中文乱码问题

我与影子孤独终老i 提交于 2020-01-17 03:24:28
一、 Qt 4 乱码问题 解决方案 1. 在Qt 中 快捷菜单选项功能中   Edit(编辑) --> Select Encoding...(选择编码)   选择载入(显示)编码和储存编码,要解决中文乱码问题,选择 GB2312和UTF-8常用编码方式 就可以 2.在 Qt 快捷菜单选项中依次选择   Tools --> Options --> Text Editor --> Behavior --> File Encodings   选择默认编码方式 UTF-8 或 GBK(gbk) 字符集 3. 在(main.cpp )代码中 #include <QTextCodec> QTextCodec *codec = QTextCodec::codecForName("utf8"); //GBK gbk QTextCodec::setCodecForTr(codec); QTextCodec::setCodecForLocale(codec); QTextCodec::setCodecForCStrings(codec); 二、Qt 5 乱码问题 解决方案: 由于 Qt 5 中移除了 <QTextCodec> 中一些函数 所以就不能像Qt 4 版本样解决 但是在QString 类中 1. 有个静态字符转码函数 QString::fromLocal8Bit --> 转码成Unicode

S3的中文编码问题及修复方案

六月ゝ 毕业季﹏ 提交于 2020-01-13 13:18:20
S3的中文编码问题及修复方案 原创 小包子大 网易游戏运维平台 2019-08-10 小包子大 06 年加入网易游戏,先后负责过多个端游/手游产品的运维工作;多年运维生涯,历经数次运维技术变革;本人关注广泛,Web/CDN,自动化,分布式等,欢迎来侃;作为十多年运维老兵, 平日写些别人看着晦涩的东西,擅长手术刀式的运维杂症分析。 二个月前,游戏的流媒体站点从物理机迁移到了 S3,迁移过程中发生了一些小插曲,今天分享下其中的 S3 中文文件名的编码问题及解决方法。 这里指的中文,是指文件名带中文,而不是文件内容。 中文主要有 2 种编码,UTF-8 与 GBK,服务器环境大都是 UTF-8 编码,而 Windows 系统则采用 GBK。 PS. 本文档不区分字符集与字符编码,二者在这里可以混用。 一、中文文件名与S3上传的编码问题 当上传到 S3 的文件名带有中文时,上传时的编码环境很重要。 文件名采用什么编码,就需要在相应的编码环境上传,否则无法上传 比如,一个文件名采用 GBK 编码的文件,在 GBK 编码环境下,正常上传 而同一个文件,切换到 UTF-8 环境下,上传报错 上面这个编码要求还算说得过去,但当以目录为单位上传到 S3 时,异常编码的文件,会被 “静默地“ 忽略掉! 即当你想同步整个目录到 S3 时,实际只是同步了名字编码没有问题的文件,请注意这个坑。 二、S3

ASCII,Unicode,UTF-8 和 GBK

烂漫一生 提交于 2020-01-13 05:00:12
转自 http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 。 如果我也有想阮一峰一样的探究总结能力,一定会变得越来越好。 简单来说, Unicode 是最全的编码方式,囊括世界上所有的符号。 UTF-8 是 Unicode 的实现方式之一,它主要采用了变长存储的方式解决了Unicode 存储空间过大问题。 ASCII 码一共规定了128个字符,对于英文表示是完全足够了。UTF-8表示单字符时和ASCII码是一致的,也就是说,对于128个ASCII码对应的字符,其使用UTF-8编码方式和ASCII码完全一致。 GBK 是汉字编码的一种方式,与Unicode 和 UTF-8 是毫无关系的,但都是一种对字符的编码方式。 正文: 一、 ASCII 码 我们知道,计算机内部,所有信息最终都是一个二进制值。每一个二进制位(bit)有 0 和 1 两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从 00000000 到 11111111 。 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为 ASCII 码,一直沿用至今。 ASCII

错误:编码GBK的不可映射字符

对着背影说爱祢 提交于 2020-01-11 20:54:37
  当Java源代码中包含中文字符时,我们在用javac编译时会出现“错误:编码GBK的不可映射字符”。   由于JDK是国际版的,我们在用javac编译时,编译程序首先会获得我们操作系统默认采用的编码格式(GBK),然后JDK就把Java源文件从GBK编码格式转换为Java内部默认的Unicode格式放入内存中,然后javac把转换后的Unicode格式的文件编译成class类文件,此时,class文件是Unicode编码的,它暂存在内存中,紧接着,JDK将此以Unicode格式编码的class文件保存到操作系统中形成我们见到的class文件。当我们不加设置就编译时,相当于使用了参数:javac -encoding GBK Test.java,就会出现不兼容的情况。   使用-encoding参数指明编码方式:javac -encoding UTF-8 Test.java,就可以了。 来源: https://www.cnblogs.com/lucky-zhangcd/p/8409810.html

java发送手机短信

允我心安 提交于 2020-01-11 12:24:09
JAVA发送手机短信有几种方法: (1)使用webservice接口发送手机短信,这个可以使用sina提供的webservice进行发送,但是需要进行注册; (2)使用短信mao的方式进行短信的发送,这种方式应该是比较的常用,前提是需要购买硬件设备; (3)使用中国网建提供的SMS短信平台(申请账号地址:http://sms.webchinese.cn/default.shtml) 本程序主要是运用了中国网建提供的SMS短信平台,这个短信平台基于java提供个专门的接口,其原理是:给用户发送短信主要是通过移动提供给的接口,而我们程序主要是将短信信息(手机号码、短信内容)发给这个接口,之后就是移动的事情了(根据信息发给相应的用户).... 下面是我的java代码,仅供参考: [html] view plain copy print ? package in.dapai.server; import org.apache.commons.httpclient.Header; import org.apache.commons.httpclient.HttpClient; import org.apache.commons.httpclient.NameValuePair; import org.apache.commons.httpclient.methods.PostMethod;

Python:将utf-8格式的文件转换成gbk格式的文件

拥有回忆 提交于 2020-01-11 09:14:34
需求:将utf-8格式的文件转换成gbk格式的文件 实现代码如下: def ReadFile(filePath,encoding="utf-8"): with codecs.open(filePath,"r",encoding) as f: return f.read() def WriteFile(filePath,u,encoding="gbk"): with codecs.open(filePath,"w",encoding) as f: f.write(u) def UTF8_2_GBK(src,dst): content = ReadFile(src,encoding="utf-8") WriteFile(dst,content,encoding="gbk") 代码讲解: 函数ReadFile的第二个参数指定以utf-8格式的编码方式读取文件,返回的结果content为Unicode 然后,在将Unicode以gbk格式写入文件中。 这样就能实现需求。 但是,如果要转换格式的文件中包含有一些字符并不包含在gbk字符集中的话,就会报错,类似如下: UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0' in position 4813: illegal multibyte sequence