输入采用input()方法。input输入的元素都是以str形式保存的。输出采用print()方法。
Python中没有代表EOF的字符,因此检测到输入EOF时会直接报错EOFerror。因此我们要采用下面的写法来检测输入到EOF后停止循环输入:
while True:
try:
s = int(input())
print(s)
except:
print('input complete')
break
1
2
3
4
5
6
7
如果在cmd.exe中运行这段代码,输入Ctrl+Z即可停止输入。如果是在Pycharm内建运行框中运行这段代码,输入Ctrl+D即可停止输入。
如果是在Python中读取文件,Python到读取到文件结尾后是返回空字符串的,所以python可以这样判断:
str = ''
with open('readme.txt', 'r', encoding='utf-8') as fp:
while True:
s = fp.read(10)
if s == '':
break
str += s
print(str)
1
2
3
4
5
6
7
8
Python字符串类型、空值类型、Unicode编码、UTF-8编码、格式化字符串
字符串是以单引号’或双引号"括起来的任意文本。如果字符串内部既包含’又包含",可以用转义字符\来标识。\n表示换行,\t表示制表符,\表示\。Python还允许用r’ ‘表示’ '内部的字符串默认不转义。
空值是Python里一个特殊的值,用None表示。None不能理解为0,因为0是有意义的,而None是一个特殊的空值。
Unicode编码把所有语言都统一到一套编码里,这样就不会再有乱码问题。Unicode最常用的是用两个字节表示一个字符(很生僻的字符会被编码成4个字节)。比如把ASCII编码的A用Unicode编码表示,只需要在前面补0就可以,因此,A的Unicode编码是00000000 01000001。
UTF-8编码相当于对unicode编码的优化,它一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。ASCII编码实际上可以被看成是UTF-8编码的一部分,所以,大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。
注意:
Python3的字符串类型是str,在内存中以Unicode编码表示。如果要在网络上传输,或者保存到磁盘上,就需要把str变为以字节为单位的bytes。
Python提供了ord()方法来获取某个字符的Unicode编码,而chr()方法把Unicode编码转换成对应的字符。如:
s1 = "A"
s2 = "1"
s3 = "你"
print(ord(s1))
print(ord(s2))
print(ord(s3))
print(chr(66))
print(chr(20500))
1
2
3
4
5
6
7
8
Python对bytes类型的数据用带b前缀的单引号或双引号表示:
x = b'ABC'
1
Python提供了encode()方法可以将str编码为指定类型的bytes,decode()方法把bytes变为str。如:
s1 = "ABC"
s2 = s1.encode('ascii')
s3 = "你好"
print(s1.encode('ascii'))
print(s3.encode('utf-8'))
print(s2.decode('ascii'))
1
2
3
4
5
6
含有中文的str无法用ASCII编码,因为中文编码的范围超过了ASCII编码的范围,Python会报错。为了避免乱码问题,我们应当坚持使用UTF-8编码对str和bytes进行转换。
当Python解释器读取源代码时,为了让它按UTF-8编码读取,我们通常在文件开头写上这两行命令:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
1
2
第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。除此之外,我们还要确保所使用的IDE正在使用UTF-8 编码。
格式化字符串的输出方式:
%运算符就是用来格式化字符串的。%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应。格式化整数和浮点数还可以指定是否补0和整数与小数的位数。我们还可以用format用法来格式化输出。如:
print("%2d %02d" % (3, 1))
print("%.2f" % 3.1415926)
print("{} {}".format(3, 1.21))
print("{:02d} {:.2f}".format(3, 3.1415926))
1
2
3
4
Python条件判断、循环
判断语句的形式:
if 判断条件:
执行语句......
elif 判断条件:
执行语句......
else:
执行语句......
1
2
3
4
5
6
注意elif、else的判断语句视情况添加。
Python提供了for循环和while循环(在Python中没有do…while循环),形式如下:
for x in sequence:
statements(s)
while 判断条件:
执行语句......
1
2
3
4
5
break语句会打断当前层的循环,continue语句则会直接结束本次循环,开始下一次循环。
Python不可变对象和可变对象
不可变对象指该对象所指向的内存中的值不能被改变。当改变某个变量时候,由于其所指的值不能被改变,相当于把新的值放在一个新地址,变量再指向这个新的地址。
可变对象指该对象所指向的内存中的值可以被改变。变量改变后,实际上是其所指的值直接发生改变,并没有发生复制行为,也没有开辟新的地址,通俗点说就是原地改变。
在Python中,数值类型(int和float)、字符串、元组都是不可变类型。而列表、字典、集合是可变类型。
Python中的参数传递
在Python中所有的变量名都可以理解是内存中对一个对象的"引用",类似于C++中的指针。
Python中的类型是属于对象的,而不是变量。而对象分可变对象和不可变对象。比如字符串、元组和数值类型都是不可变对象,而列表、字典和集合都是可变对象。
当一个变量名(也就是对一个对象的引用)传递给函数的时候,函数自动复制一份引用。当这个变量指向的是不可变对象时,我们修改变量内容时,实际上是在内存中新开辟了一块地址,将新内容写在这里,然后把变量名指向新开辟的地址;而当这个变量指向的是可变对象时,我们修改变量内容时就类似C++中从函数名中传入指针一样,直接在变量指向的内存地址上修改。
举例:
a = 1
def fun(b):
print(id(b))
b = 2
print(id(b), id(2))
print(id(a), id(1))
fun(a)
print(a)
c = []
def fun(d):
print(id(d))
d.append(1)
print(id(d))
print(id(c))
fun(c)
print(c)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Python字典与集合
字典可存储任意类型对象,如字符串、数字、元组等其他容器模型。字典的每个键值 key:value对用冒号分割,每个键值对之间用逗号分割,整个字典包括在花括号{}中。一个key只能对应一个value,同一个key放入多个value值后放入的会把前面放入的value值覆盖。
.get()方法可指定key得到对应的value,如果key不存在则返回None。pop()方法可以删除一个key:value。
注意:
字典内部存放的顺序和key放入的顺序无关。字典查找和插入的速度极快,不会随着key的增加而变慢,但需要占用大量的内存,内存浪费多。它是一种用空间来换取时间的一种方法。
字典的key必须是不可变对象。字典(Dictionary)根据key来计算value的存储位置,这个通过key计算位置的算法称为哈希算法。要保证hash的正确性,作为key的对象就不能变。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。而list是可变的,就不能作为key。
集合可以看成数学意义上的无序和无重复元素的集合。set同样不可以放入可变对象。集合用来存储一组key,但不存储value,在set中,没有重复的key。
我们可以使用大括号{ }或set()函数创建集合。创建一个空集合必须用set()而不是 { },因为{ }是用来创建一个空字典。
add()方法可以向set中添加元素,remove()方法可以删除元素,两个set还可以做数学意义上的交集、并集等操作。
Python集合去重原理
set的去重是通过两个函数__hash__和__eq__结合实现的。当两个变量的哈希值不相同时,就认为这两个变量是不同的;当两个变量哈希值一样时,调用__eq__方法,当返回值为True时认为这两个变量是同一个,应该去除一个。返回FALSE时,不去重。
Python列表与元组
列表即一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型,并且list里的元素也可以是另一个list。如:
M = ['A', 1, 1.5]
1
len()可求得列表元素个数,.append()末尾增加一个元素,.insert()指定位置插入一个元素,pop()删除指定位置元素。
元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号( ),列表使用方括号[ ]。元组没有.append(),.insert(),pop()方法。元组中其他访问和获取元素的方法和list是一样的。元组在定义时,其中的元素就必须被确定下来。
只有1个元素的元组定义时必须加一个逗号,,来消除歧义:
T = (1,) # 这是一个元组
1
元组的元素是不可变的,但是如果元组的某个元素是列表时,列表内的元素是可变的。
来源:https://www.cnblogs.com/dianziyihao/p/12446604.html