基本数据类型
字符串 String
字符串是不可变类型
字符串的分割:
s.split(sep)以给定的sep为分隔符对s进行分割。
In [4]:
s = "hello world" s.split()
Out[4]:
['hello', 'world']
In [11]:
line = "1,2,3,4,5" numbers = line.split(',')
连接
与分割相反,s.join(str_sequence)的作用是以s为连接符将字符串序列str_sequence中的元素连接起来,并返回连接后得到的新字符串:
In [13]:
s = ',' s.join(numbers)
Out[13]:
'1,2,3,4,5'
替换
s.replace(part1, part2)将字符串s中指定的部分part1替换成想要的部分part2,并返回新的字符串。 每个部分都会替换 不止是第一个 s的值本身没有发生变化 只是生成一个新的字符串
In [17]:
s = "hello world" s.replace('l', ' python ')
Out[17]:
'he python python o wor python d'
In [19]:
s
Out[19]:
'hello world'
大小写转换
s.upper()方法返回一个将s中的字母全部大写的新字符串。
s.lower()方法返回一个将s中的字母全部小写的新字符串。
这两种方法也不会改变原来s的值:
In [20]:
"hello world".upper()
Out[20]:
'HELLO WORLD'
数字
取整
In [7]:
round(21.6)
Out[7]:
22
列表
删除元素
Python提供了删除列表中元素的方法 'del'。
删除列表中的第一个元素:
In [22]:
a = [1002, 'a', 'b', 'c'] del a[1] a
Out[22]:
[1002, 'b', 'c']
In [25]:
a = [1002, 'a', 'b', 'c'] del a[1:] a
Out[25]:
[1002]
删除间隔的元素
In [24]:
a = ['a', 1, 'b', 2, 'c'] del a[::2] a
Out[24]:
[1, 2]
列表方法
不改变列表的方法
列表中某个元素个数count
l.count(ob)
返回列表中元素 ob
出现的次数。
a = [11, 12, 13, 12, 11] a.count(11)
列表中某个元素位置index
l.index(ob)
返回列表中元素 ob
第一次出现的索引位置,如果 ob
不在 l
中会报错。
In [25]:
a.index(12)
Out[25]:
1
不存在的元素会报错:
In [26]:
a.index(1) --------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-26-ed16592c2786> in <module>() ----> 1 a.index(1) ValueError: 1 is not in list
改变列表的方法
向列表添加单个元素
l.append(ob)
将元素 ob
添加到列表 l
的最后。
In [27]:
a = [10, 11, 12] a.append(11) print a [10, 11, 12, 11]
append每次只添加一个元素,并不会因为这个元素是序列而将其展开:
In [28]:
a.append([11, 12]) print a [10, 11, 12, 11, [11, 12]]
向列表添加序列
l.extend(lst)
将序列 lst
的元素依次添加到列表 l
的最后,作用相当于 l += lst
。
In [29]:
a = [10, 11, 12, 11] a.extend([1, 2]) print a [10, 11, 12, 11, 1, 2]
插入元素
l.insert(idx, ob)
在索引 idx
处插入 ob
,之后的元素依次后移。
In [30]:
a = [10, 11, 12, 13, 11] # 在索引 3 插入 'a' a.insert(3, 'a') print a [10, 11, 12, 'a', 13, 11]
移除元素
l.remove(ob)
会将列表中第一个出现的 ob
删除,如果 ob
不在 l
中会报错。
In [31]:
a = [10, 11, 12, 13, 11] # 移除了第一个 11 a.remove(11) print a [10, 12, 13, 11]
弹出元素
l.pop(idx)
会将索引 idx
处的元素删除,并返回这个元素。
In [32]:
a = [10, 11, 12, 13, 11] a.pop(2)
Out[32]:
12
排序
l.sort()
会将列表中的元素按照一定的规则排序:
In [33]:
a = [10, 1, 11, 13, 11, 2] a.sort() print a [1, 2, 10, 11, 11, 13]
如果不想改变原来列表中的值,可以使用 sorted
函数:
In [34]:
a = [10, 1, 11, 13, 11, 2] b = sorted(a) print a print b [10, 1, 11, 13, 11, 2] [1, 2, 10, 11, 11, 13]
list.sort(cmp=None, key=None, reverse=False) key -- 主要是用来进行比较的元素,只有一个参数,具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序。 reverse -- 排序规则,reverse = True 降序, reverse = False 升序(默认) # 获取列表的第二个元素 def takeSecond(elem): return elem[1] # 列表 random = [(2, 2), (3, 4), (4, 1), (1, 3)] # 指定第二个元素排序 random.sort(key=takeSecond) # 输出类别 print '排序列表:', random 输出:排序列表:[(4, 1), (2, 2), (1, 3), (3, 4)]
列表反向
l.reverse()
会将列表中的元素从后向前排列。
In [35]:
a = [1, 2, 3, 4, 5, 6] a.reverse() print a [6, 5, 4, 3, 2, 1]
如果不想改变原来列表中的值,可以使用这样的方法:
In [36]:
a = [1, 2, 3, 4, 5, 6] b = a[::-1] print a print b [1, 2, 3, 4, 5, 6] [6, 5, 4, 3, 2, 1]
元组
基本操作
与列表相似,元组Tuple
也是个有序序列,但是元组是不可变的,用()
生成。
In [1]:
t = (10, 11, 12, 13, 14) t (10, 11, 12, 13, 14)
但是元组是不可变的:
单个元素的元组生成
由于()
在表达式中被应用,只含有单个元素的元组容易和表达式混淆,所以采用下列方式定义只有一个元素的元组:
In [5]:
a = (10,) print a print type(a) (10,) <type 'tuple'>
In [6]:
a = (10) print type(a) <type 'int'>
将列表转换为元组:
In [7]:
a = [10, 11, 12, 13, 14] tuple(a)
Out[7]:
(10, 11, 12, 13, 14)
元组方法
由于元组是不可变的,所以只能有一些不可变的方法,例如计算元素个数 count
和元素位置 index
,用法与列表一样。
a.count(10) a.index(12)
字典
空字典
Python 使用 {}
或者 dict()
来创建一个空的字典:
In [1]:
a = {} type(a) dict a = dict() type(a) dict b = {'one': 'this is number 1', 'two': 'this is number 2'} b['one'] 'this is number 1'
字典没有顺序
当我们 print
一个字典时,Python并不一定按照插入键值的先后顺序进行显示,因为字典中的键本身不一定是有序的。
print(a) {'two': 'this is number 2', 'one': 'this is number 1, too'}
因此,Python中不能用支持用数字索引按顺序查看字典中的值,而且数字本身也有可能成为键值,这样会引起混淆:
键必须是不可变的类型 ,而值可以是任意的Python对象。
使用 dict 初始化字典
除了通常的定义方式,还可以通过 dict()
转化来生成字典:
inventory = dict( [('foozelator', 123), ('frombicator', 18), ('spatzleblock', 34), ('snitzelhogen', 23) ]) inventory {'foozelator': 123, 'frombicator': 18, 'snitzelhogen': 23, 'spatzleblock': 34}
利用索引直接更新键值对:
In [15]:
inventory['frombicator'] += 1 inventory {'foozelator': 123, 'frombicator': 19, 'snitzelhogen': 23, 'spatzleblock': 34}
适合做键的类型
在不可变类型中,整数和字符串是字典中最常用的类型;而浮点数通常不推荐用来做键,原因:浮点数的精度问题
有时候,也可以使用元组作为键值,例如,可以用元组做键来表示从第一个城市飞往第二个城市航班数的多少:
In [19]:
connections = {} connections[('New York', 'Seattle')] = 100 connections[('Austin', 'New York')] = 200 connections[('New York', 'Austin')] = 400
元组是有序的,因此 ('New York', 'Austin')
和 ('Austin', 'New York')
是两个不同的键:
字典方法
get
方法
用索引可以找到一个键对应的值,但是当字典中没有这个键的时候,Python会报错,这时候可以使用字典的 get
方法来处理这种情况,其用法如下:
`d.get(key, default = None)`
返回字典中键 key
对应的值,如果没有这个键,返回 default
指定的值(默认是 None
)。
In [21]:
a = {} a["one"] = "this is number 1" a["two"] = "this is number 2" a["three"] --------------------------------------------------------------------------- KeyError Traceback (most recent call last) <ipython-input-22-8a5f2913f00e> in <module>() ----> 1 a["three"] KeyError: 'three' print a.get("three") None
pop
方法删除元素
pop
方法可以用来弹出字典中某个键对应的值,同时也可以指定默认参数:
d.pop(key, default = None)`
删除并返回字典中键 key
对应的值,如果没有这个键,返回 default
指定的值(默认是 None
)。
与列表一样,del
函数可以用来删除字典中特定的键值对,例如:
In [30]:
del a["one"] a
update
方法更新字典
之前已经知道,可以通过索引来插入、修改单个键值对,但是如果想对多个键值对进行操作,这种方法就显得比较麻烦,好在有 update
方法:
d.update(newd)
将字典newd
中的内容更新到d
中去。
In [31]:
person = {} person['first'] = "Jmes" person['last'] = "Maxwell" person['born'] = 1831 print person {'born': 1831, 'last': 'Maxwell', 'first': 'Jmes'}
把'first'改成'James',同时插入'middle'的值'Clerk':
In [32]:
person_modifications = {'first': 'James', 'middle': 'Clerk'} person.update(person_modifications) print person {'middle': 'Clerk', 'born': 1831, 'last': 'Maxwell', 'first': 'James'}
in
查询字典中是否有该键
In [33]:
barn = {'cows': 1, 'dogs': 5, 'cats': 3} 'chickens' in barn False
keys
方法,values
方法和items
方法
d.keys()
返回一个由所有键组成的列表;
d.values()
返回一个由所有值组成的列表;
d.items()
返回一个由所有键值对元组组成的列表;
In [36]:
barn.keys() ['cows', 'cats', 'dogs'] barn.values() [1, 3, 5] barn.items() [('cows', 1), ('cats', 3), ('dogs', 5)]
集合
列表和字符串都是一种有序序列,集合 set
是一种无序的序列。
因为集合是无序的,所以当集合中存在两个同样的元素的时候,Python只会保存其中的一个(唯一性);同时为了确保其中不包含同样的元素,集合中放入的元素只能是不可变的对象(确定性)。
集合生成
可以用set()
函数来显示的生成空集合:
In [1]:
a = set() type(a)
也可以使用一个列表来初始化一个集合:
In [2]:
a = set([1, 2, 3, 1]) a {1, 2, 3}
集合会自动去除重复元素 1
。
可以看到,集合中的元素是用大括号{}
包含起来的,这意味着可以用{}
的形式来创建集合:
In [3]:
a = {1, 2, 3, 1} a {1, 2, 3}
但是创建空集合的时候只能用set
来创建,因为在Python中{}
创建的是一个空的字典:
集合操作
并
两个集合的并,返回包含两个集合所有元素的集合(去除重复)。
可以用方法 a.union(b)
或者操作 a | b
实现。
交
两个集合的交,返回包含两个集合共有元素的集合。
可以用方法 a.intersection(b)
或者操作 a & b
实现。
差
a
和 b
的差集,返回只在 a
不在 b
的元素组成的集合。
可以用方法 a.difference(b)
或者操作 a - b
实现。
对称差
a
和b
的对称差集,返回在 a
或在 b
中,但是不同时在 a
和 b
中的元素组成的集合。
可以用方法 a.symmetric_difference(b)
或者操作 a ^ b
实现(异或操作符)。
包含关系
两个集合A、B,集合A中任意一个元素都是集合B中的元素,我们就说这两个集合有[包含]关系,称集合A为集合B的子集
要判断 b
是不是 a
的子集,可以用 b.issubset(a)
方法,或者更简单的用操作 b <= a
:
方法只能用来测试子集,但是操作符可以用来判断真子集:( 如果集合A是集合B的子集,并且集合B不是集合A的子集 )
a <= a True
自己不是自己的真子集:
a < a False
集合方法
add
方法向集合添加单个元素
跟列表的 append
方法类似,用来向集合添加单个元素。
s.add(a)
将元素 a
加入集合 s
中。
t = {1, 2, 3} t.add(5) t {1, 2, 3, 5}
如果添加的是已有元素,集合不改变:
update
方法向集合添加多个元素
跟列表的extend
方法类似,用来向集合添加多个元素。
s.update(seq)
将seq
中的元素添加到s
中。
t.update([5, 6, 7]) t {1, 2, 3, 5, 6, 7}
remove
方法移除单个元素
s.remove(ob)
从集合s
中移除元素ob
,如果不存在会报错。
pop方法弹出元素
由于集合没有顺序,不能像列表一样按照位置弹出元素,所以pop
方法删除并返回集合中任意一个元素,如果集合中没有元素会报错。
t.pop() {3, 5, 6, 7}
discard 方法
作用与 remove
一样,但是当元素在集合中不存在的时候不会报错。
difference_update方法
a.difference_update(b)
从a中去除所有属于b的元素:
不可变集合
对应于元组(tuple
)与列表(list
)的关系,对于集合(set
),Python提供了一种叫做不可变集合(frozen set
)的数据结构。
使用 frozenset
来进行创建:
s = frozenset([1, 2, 3, 'a', 1]) s frozenset({1, 2, 3, 'a'})
与集合不同的是,不可变集合一旦创建就不可以改变。
不可变集合的一个主要应用是用来作为字典的键,例如用一个字典来记录两个城市之间的距离:
In [2]:
flight_distance = {} city_pair = frozenset(['Los Angeles', 'New York']) flight_distance[city_pair] = 2498 flight_distance[frozenset(['Austin', 'Los Angeles'])] = 1233 flight_distance[frozenset(['Austin', 'New York'])] = 1515 flight_distance
Out[2]:
{frozenset({'Austin', 'New York'}): 1515, frozenset({'Austin', 'Los Angeles'}): 1233, frozenset({'Los Angeles', 'New York'}): 2498}
由于集合不分顺序,所以不同顺序不会影响查阅结果:
In [3]:
flight_distance[frozenset(['New York','Austin'])]
Out[3]:
1515
In [4]:
flight_distance[frozenset(['Austin','New York'])]
Out[4]:
1515