gbk

python的编码问题

别来无恙 提交于 2020-03-24 09:35:58
最近在用python写一些辅助脚本,发现每次运行的时候都会出现无法解析的字符编码的问题 后来发现是因为在代码的头里面加了这么一行 #coding=utf-8 加了这么一行就会出现这个错误 SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte 这个错误的大概意思就是python在寻找UTF-8标致头的时候出现了错误 出现这个错误的原因是我们在文件头给python指定了编码为UTF-8,但是我们文件确是以GBK的方式存储的 所以只要把utf-8改成gbk就可以了,这样python就会认为这是一个gbk的编码文件,而不会想去查找UTF-8的头 题外话: 为了识别文件究竟是UTF-8还是ASCII,一般UTF-8都会在文件头部加入EF BB这个头,而GBK是没有头的,所以python发现没有这个头则会认为是错误的 之前在用QT的时候也遇到了这些问题 http://www.cnblogs.com/linyilong3/p/4868697.html 其实中文编码的问题已经存在很多年了,只是一直没人去解决,最近我开始碰到后,才开始着手解决这个问题,争取有空把原来的中文问题都解决掉 来源: https://www.cnblogs.com

Python中使用中文

吃可爱长大的小学妹 提交于 2020-03-19 12:37:46
python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识。当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题,不用我们这么麻烦了。 先来看看python的版本: >>> import sys >>> sys.version '2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit (Intel)]' (一) 用记事本创建一个文件ChineseTest.py,默认ANSI: s = "中文" print s 测试一下瞧瞧: E:/Project/Python/Test>python ChineseTest.py File "ChineseTest.py", line 1 SyntaxError: Non-ASCII character '/xd6' in file ChineseTest.py on line 1, but no encoding declared; see http://www.pytho n.org/peps/pep-0263.html for details 偷偷地把文件编码改成UTF-8: E:/Project/Python/Test>python ChineseTest.py File "ChineseTest.py", line 1

Python疑难杂症:SyntaxError: Non-ASCII character Python中文处理问题

心已入冬 提交于 2020-03-19 12:36:49
python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识。当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题,不用我们这么麻烦了。 先来看看python的版本: >>> import sys >>> sys.version ' 2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit (Intel)] ' (一)用记事本创建一个文件ChineseTest.py,默认ANSI: s = " 中文 " print s 测试一下瞧瞧: E:\Project\Python\Test>python ChineseTest.py File "ChineseTest.py", line 1 SyntaxError: Non-ASCII character '\xd6' in file ChineseTest.py on line 1, but noencodingdeclared; see http://www.pytho n.org/peps/pep-0263.html for details 偷偷地把文件编码改成UTF-8: E:\Project\Python\Test>python ChineseTest.py File "ChineseTest.py", line 1

Python疑难杂症:SyntaxError: Non-ASCII character Python中文处理问题

丶灬走出姿态 提交于 2020-03-19 12:36:11
python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识。当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题,不用我们这么麻烦了。 先来看看python的版本: >>> import sys >>> sys.version ' 2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit (Intel)] ' (一)用记事本创建一个文件ChineseTest.py,默认ANSI: s = " 中文 " print s 测试一下瞧瞧: E:\Project\Python\Test>python ChineseTest.py File "ChineseTest.py", line 1 SyntaxError: Non-ASCII character '\xd6' in file ChineseTest.py on line 1, but noencodingdeclared; see http://www.pytho n.org/peps/pep-0263.html for details 偷偷地把文件编码改成UTF-8: E:\Project\Python\Test>python ChineseTest.py File "ChineseTest.py", line 1

Python Unicode与中文处理

感情迁移 提交于 2020-03-19 12:35:22
转自:http://blog.csdn.net/dao123mao/article/details/5396497 python中的unicode是让人很困惑、比较难以理解的问题,本文力求彻底解决这些问题; 1.unicode、gbk、gb2312、utf-8的关系; http://www.pythonclub.org/python-basic/encode-detail 这篇文章写的比较好,utf-8是unicode的一种实现方式,unicode、gbk、gb2312是编码字符集; 2.python中的中文编码问题; 2.1 .py文件中的编码 Python 默认脚本文件都是 ANSCII 编码的,当文件 中有非 ANSCII 编码范围内的字符的时候就要使用"编码指示"来修正。 一个module的定义中,如果.py文件中包含中文字符(严格的说是含有非anscii字符),则需要在第一行或第二行指定编码声明: # -*- coding=utf-8 -*-或者 #coding=utf-8 其他的编码如:gbk、gb2312也可以; 否则会出现类似:SyntaxError: Non-ASCII character '/xe4' in file ChineseTest.py on line 1, but no encoding declared; see http://www.pytho

Python二三事 - 接触Python(x,y)

余生颓废 提交于 2020-03-18 11:52:27
注释:本文原来转自博客大巴的一篇文章,向原作者致谢!我也做了相应的修改,更加完善对于Pythonx,y的介绍 Python 二三事   面向初学者介绍Python相关的一些工具,以及可能遇到的常见问题。 更新1st 2011.1.15 更新2nd 2012.3.4 引言 在这里我假设你已经看完了一篇Python教程,基本熟悉了Python的结构和语法,在命令行下的Python互动环境中尝试过大部分Python的语句,觉得Python是个不错的语言准备继续下去。那么本篇文章会就Python实际运用中相关工具的选择,包括IDE,调试套件,第三方库管理工具这些进行介绍。另外还会对某些中文环境下容易遇到的问题,例如unicode编码解码的问题进行说明。本文主要是针对 Windows 环境下的 Python 开发进行说明。文章的目的是为了分享些我觉得很有用的经验和例子,若发现文中有疏漏之处请务必联系我。谢谢。 Python 语言介绍 Python 是一个近些年在开始流行起来的计算机编程语言。根据 Python官网 上的简介,Python主要特性包括跨平台,免费,简单且容易维护。就我个人理解来说,Python是一门适合大部分人的语言,因为各种类型的第三方库都有,所以像简单桌面程序,动态网站开发,图像处理,表格处理,甚至自动发帖机这些小应用在简单的学习后

文件处理

孤街浪徒 提交于 2020-03-17 10:37:36
1 #文件处理读操作 2 3 # f = open('haha.py') 4 # data = f.read() 5 # print(data) 6 # f.close() 7 8 9 f = open('haha.py','r') 10 # data = f.read() 11 # print(data) 12 # print('第一行',f.readable()) #文件是否可读 13 14 # print('第二行',f.readline(),end='') 15 # print('第三行',f.readline()) 16 # print('第四行',f.readline()) 17 # print('第五行',f.readline()) 18 # print('第六行',f.readline()) #一次读一行 19 20 # data = f.readlines() 21 # print(data) 22 23 24 ###############文件处理写操作 25 26 27 # f = open('haha.py','w') 28 # f.write('45\n') 29 # f.write('12\n') 30 # f.write('45\n') 31 # f.write('45\n45\n879\n96\n') 32 33 #f.writable() 是否可写

php mssql 中文各种乱码

半城伤御伤魂 提交于 2020-03-16 12:46:04
1 查询输出时乱码 (SELECT ) 因为MSSQL 数据库一般都是 GBK 编码,所以在php页面中加入 header('Content-Type:text/html; charset=GBK'); 也可以使用 以下语句查看: 然后按对应表设置字符集. SELECT COLLATIONPROPERTY('Chinese_PRC_90_CI_AI', 'CodePage') 返回值对应表: 936 简体中文GBK 950 繁体中文BIG5 437 美国/加拿大英语 932 日文 949 韩文 866 俄文 65001 unicode UFT-8 2 插入时乱码(INSERT) 插入时乱码,要对查询的 sql 语句进行字符集的转换 $insert = "Insert into peple(name,sex) VALUES(N'帅哥','male') ";$insert = iconv("utf-8", "gbk", $insert); 3 更新时(UPDATE) 同上,对更新SQL语句进行 字符集的转换. 来源: https://www.cnblogs.com/BinBinGo/p/5693732.html

一文说清文本编码那些事

只谈情不闲聊 提交于 2020-03-15 20:34:19
一直以来,编码问题像幽灵一般,不少开发人员都受过它的困扰。 试想你请求一个数据,却得到一堆乱码,丈二和尚摸不着头脑。有同事质疑你的数据是乱码,虽然你很确定传了 UTF-8 ,却也无法自证清白,更别说帮同事 debug 了。 有时,靠着百度和一手瞎调的手艺,乱码也能解决。尽管如此,还是很羡慕那些骨灰级程序员。为什么他们每次都能犀利地指出问题,并快速修复呢?原因在于,他们早就把编码问题背后的各种来龙去脉搞清楚了。 本文从 ASCII 码说起,带你扒一扒编码背后那些事。相信搞清编码的原理后,你将不再畏惧任何编码问题。 从 ASCII 码说起 现代计算机技术从英文国家兴起,最先遇到的也是英文文本。英文文本一般由 26 个字母、 10 个数字以及若干符号组成,总数也不过 100 左右。 计算机中最基本的存储单位为 字节 ( byte ),由 8 个比特位( bit )组成,也叫做 八位字节 ( octet )。 8 个比特位可以表示 $ 2^8 = 256 $ 个字符,看上去用字节来存储英文字符即可? 计算机先驱们也是这么想的。他们为每个英文字符编号,再加上一些控制符,形成了我们所熟知的 ASCII 码表。实际上,由于英文字符不多,他们只用了字节的后 7 位而已。 根据 ASCII 码表,由 01000001 这 8 个比特位组成的八位字节,代表字母 A 。 顺便提一下,比特本身没有意义,

【2020Python修炼记13】Python语法入门—字符编码

夙愿已清 提交于 2020-03-12 19:06:12
一、知识储备 1、三大核心硬件——CPU,内存,硬盘 所有软件都是运行硬件之上的,与运行软件相关的三大核心硬件为cpu、内存、硬盘 #1、软件运行前,软件的代码及其相关数据都是存放于硬盘中的 #2、任何软件的启动都是将数据从硬盘中读入内存,然后cpu从内存中取出指令并执行 #3、软件运行过程中产生的数据最先都是存放于内存中的,若想永久保存软件产生的数据,则需要将数据由内存写入硬盘 2、文本编辑器读取文件内容的流程 #阶段1、启动一个文件编辑器(文本编辑器如nodepad++,pycharm,word) #阶段2、文件编辑器会将文件内容从硬盘读入内存 #阶段3、文本编辑器会将刚刚读入内存中的内容显示到屏幕上 3、Python解释器执行文件的流程 以python test.py为例,执行流程如下: #阶段1、启动python解释器,此时就相当于启动了一个文本编辑器 #阶段2、python解释器相当于文本编辑器,从硬盘上将test.py的内容读入到内存中 #阶段3、python解释器解释执行刚刚读入的内存的内容,开始识别python语法 4、总结—Python解释器&文本编辑器的异同 #1、相同点: 前两个阶段二者完全一致,都是将硬盘中文件的内容读入内存,详解如下 python解释器是解释执行文件内容的,因而python解释器具备读py文件的功能,这一点与文本编辑器一样 #2、不同点: