PYTHON字符编码
Python 的默认编码是 ASCII(编者注:Python 2.x) >>> import sys >>> sys.getdefaultencoding() 'ascii' 所以在 Python 源代码文件中如果不显示地指定编码的话,将出现语法错误。 #test.py print "你好" 上面是 test.py 脚本,运行 python test.py 就会包如下错误: File “test.py”, line 1 SyntaxError: Non-ASCII character ‘\xe4′ in file test.py on line 1, but no encoding declared; see http://www.python.org/ps/pep-0263.html for details 为了在源代码中支持非 ASCII 字符,必须在源文件的第一行或者第二行显示地指定编码格式: # coding=utf-8 或者 #!/usr/bin/python # -*- coding: utf-8 -*- 在 Python 中和字符串相关的数据类型,分别是 str、unicode 两种,他们都是 basestring 的子类,可见 str 与 unicode 是两种不同类型的字符串对象。 basestring / \ / \ str unicode 对于同一个汉字”好”