转自 https://www.cnblogs.com/diaosir/p/6575891.html
一、Python中序列的分类
常见序列类型包括字符串(普通字符串和unicode字符串),列表和元组.所谓序列,即成员有序排列,可通过下标访问.
二、Python序列通用操作
下面我们将分别以字符串、列表和元组为例来说明对序列的操作
- 索引
序列中的元素都是有序的、拥有自己编号(从0开始),我们可以通过索引得到序列中对应的元素:
索引也可以为负值,负数索引表示从右往左开始计数,最后一个元素索引为-1,倒数第二为-2,以此类推.
>>> s = 'abcdefg' >>> s[0] 'a' >>> s[1] 'b' >>> s[-1] 'g' >>> >>> l = [1,2,3,4,5,6,7] >>> l[4] 5 >>> l[0] 1 >>> l[-1] 7 >>> >>> t = (1,2,3,4,5,6,7) >>> t[0] 1 >>> t[-1] 7 >>> t[4] 5>>> s[::-1]'gfedcba'
2. 切片(分片)
使用索引可以获取单个元素,使用分片可以获取序列中指定范围内的元素.切片操作符[:]/[::]
- obj[start_index:end_index] 表示获取从start_index开始到end_index-1结束所有索引对应的元素
切片中冒号左边索引对应的元素晚于右边索引对应元素出现时,返回结果是[]
>>> l [1, 2, 3, 4, 5, 6, 7] >>> >>> l[0:5] [1, 2, 3, 4, 5] >>> l[4:6] [5, 6]>>> l[2:2] []>>> l[-3:-1] [5, 6]>>> l[-1:-3][]
- obj[:end_index] 表示获取从0开始到end_index-1结束所有索引对应的元素
- obj[start_index:] 表示获取start_index对应的元素以及后面所有的元素
- obj[:] 表示获取所有的元素
>>> l[:5] [1, 2, 3, 4, 5] >>> l[2:] [3, 4, 5, 6, 7]>>> l[-2:][6, 7]>>> l[:-3][1, 2, 3, 4]>>> l[:][1,2,3,4,5,6,7]>>> s[:5]'abcde'>>> s[1:]'bcdefg'>>> s[1::2]'bdf'
- [start_index:end_index:step] (step>0)表示从start_index索引对应的元素开始每step个元素取出来一个,直到取到end_index对应的元素结束(step默认为1)
>>> ll[0:9:] [1, 2, 3, 4, 5, 6, 7, 8, 9] >>> ll[0:9:1] [1, 2, 3, 4, 5, 6, 7, 8, 9] >>> ll[0:9:2] [1, 3, 5, 7, 9] >>> ll[::4] [1, 5, 9]>>> s[::-2]'geca'>>>
- [start_index:end_index:step] (step<0)表示从右到左反向提取元素,即从start_index索引对应的元素开始反向每step个元素取出来一个,直到取到end_index+1对应的元素结束.
此时start_index对应的元素要晚于end_index对应的元素出现,否则返回[]
>>> ll[0:6:-2] [] >>> ll[9:6:-2] [10, 8] >>> ll[6:9:-2] [] >>> ll[::-1] [10, 9, 8, 7, 6, 5, 4, 3, 2, 1] >>> ll[:2:-3] [10, 7, 4] >>> ll[9:2:-1] [10, 9, 8, 7, 6, 5, 4]
2. 加法
两种相同的序列才可以进行加法操作
>>> l1=[1,2,4] >>> l2=[4,5,6] >>> l3=['9','10'] >>> l1+l2 [1, 2, 4, 4, 5, 6] >>> l1+l3 [1, 2, 4, '9', '10'] >>> l1+'abcdefg' Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: can only concatenate list (not "str") to list
3.乘法
>>> 'python'*2 'pythonpython' >>> [1,2,3,4,5]*2 [1, 2, 3, 4, 5, 1, 2, 3, 4, 5] >>> ('a','b')*2 ('a', 'b', 'a', 'b') >>>
4.成员资格
>>> s 'abcdefg' >>> t (1, 2, 3, 4, 5, 6, 7) >>> l [1, 2, 3, 4, 5, 6, 7] >>> >>> >>> if 'ab' in s and 'c' in s: ... print 'yes' ... else: ... print 'no' ... yes >>> if 5 in l and 6 in t: ... print 'yes' ... else: ... print 'no' ... yes >>> >>> if 10 in l: ... print 'yes' ... else: ... print 'no' ... no>>> 10 in tFalse>>> 3 in tTrue>>> 'a' in sTrue
4.最大值、最小值、长度
>>> len(s) 7 >>> len(l) 7 >>> len(t) 7 >>> max(s) 'g' >>> max(l) 7 >>> max(t) 7 >>> min(s) 'a' >>> min(l) 1 >>> min(t) 1
三、列表(list)
列表和字符串、元组最大的区别为列表可变,字符串和元祖不可变
1.list函数 创建列表
>>> s'abcdefg'>>> t(1, 2, 3, 4, 5, 6, 7)>>> list(s) ['a', 'b', 'c', 'd', 'e', 'f', 'g'] >>> list(t) [1, 2, 3, 4, 5, 6, 7]
2.通过赋值改变列表
>>> l [1, 2, 3, 4, 5, 6, 7] >>> >>> l[1], l[2] = 10, 100 >>> l [1, 10, 100, 4, 5, 6, 7]
3.删除列表元素
>>> l [1, 2, 3, 4, 5, 6, 7] >>> >>> l[1], l[2] = 10, 100 >>> l [1, 10, 100, 4, 5, 6, 7] >>> >>> del l[0] >>> l [10, 100, 4, 5, 6, 7] >>> del l[3:] >>> l [10, 100, 4]
4.列表分片赋值
#赋值>>> l=range(10) >>> l [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>> l[:3] = 'abcdefg' >>> l ['a', 'b', 'c', 'd', 'e', 'f', 'g', 3, 4, 5, 6, 7, 8, 9] >>> l[:7] = 'xy' >>> l ['x', 'y', 3, 4, 5, 6, 7, 8, 9] >>> >>> l=range(10)>>> l[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]>>> l[:3] = ['x','yy']>>> l['x', 'yy', 3, 4, 5, 6, 7, 8, 9]>>> #插入>>> l=range(10)>>> l[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]>>> l[2:2]=[u'在第三个元素插入']>>> l[0, 1, u'\u5728\u7b2c\u4e09\u4e2a\u5143\u7d20\u63d2\u5165', 2, 3, 4, 5, 6, 7, 8, 9]>>> #删除>>> l=range(10)>>> l[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]>>> l[1:4] = '' #等价于del l[1:4]>>> l[0, 4, 5, 6, 7, 8, 9]>>> l=range(10)>>> l[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]>>> l[1:4] = []>>> l[0, 4, 5, 6, 7, 8, 9]>>>
5.列表方法
- append 在列表尾部增加元素
>>> l=[1,2,3,4] >>> l.append(5) >>> l.append(['acb']) >>> l [1, 2, 3, 4, 5, ['acb']]
- count统计元素出现的个数
>>> l [1, 2, 3, 2, 12, 3, 53, 1, 2] >>> for i in l: ... print i,'-->',l.count(i) ... 1 --> 2 2 --> 3 3 --> 2 2 --> 3 12 --> 1 3 --> 2 53 --> 1 1 --> 2 2 --> 3#元祖乱入----->>>> t(1, 2, 3, 4)>>> for i in t:... print i,'-->',t.count(i)... 1 --> 12 --> 13 --> 14 --> 1
- extend扩展原有列表
貌似列表的加法也可以"扩展列表"实际上"+"只是生成了一个新的列表,被连接的两个列表均没有改变,extend体现了列表的可变性
>>> l=range(5) >>> l [0, 1, 2, 3, 4] >>> l_add = [5,6,7,8] >>> l.extend(l_add) >>> l [0, 1, 2, 3, 4, 5, 6, 7, 8] >>> >>> l+l_add [0, 1, 2, 3, 4, 5, 6, 7, 8, 5, 6, 7, 8] >>> l [0, 1, 2, 3, 4, 5, 6, 7, 8]
- index找出某一元素第一次出现位置的索引
>>> l [0, 1, 2, 3, 4, 5, 6, 7, 8] >>> l.index(3) 3 >>> l=[1,2,1,2,2,1] >>> l.index(2) 1
- insert(index,obj)将obj插入列表index索引前面
>>> l [1, 2, 1, 2, 2, 1] >>> l.insert(0,'first') >>> l ['first', 1, 2, 1, 2, 2, 1] >>> l.insert(-1,'end') >>> l ['first', 1, 2, 1, 2, 2, 'end', 1] >>> l.insert(3,'cc') >>> l ['first', 1, 2, 'cc', 1, 2, 2, 'end', 1] >>>
- pop(index)移除列表中index索引对应的元素,默认inex=-1
>>> l ['first', 1, 2, 'cc', 1, 2, 2, 'end', 1] >>> l.pop() 1 >>> l ['first', 1, 2, 'cc', 1, 2, 2, 'end'] >>> l.pop(2) 2 >>> l ['first', 1, 'cc', 1, 2, 2, 'end']
- rmove(obj)移除列表中匹配到obj的第一个元素
>>> l['first', 1, 'cc', 1, 2, >>> l.remove(1) >>> l ['first', 'cc', 1, 2, 2]
- reverse转置列表
>>> l ['first', 'cc', 1, 2, 2] >>> l.reverse() >>> l [2, 2, 1, 'cc', 'first']
- sort给列表排序
>>> l [2, 2, 1, 'cc', 'first'] >>> l.sort() >>> l [1, 2, 2, 'cc', 'first']>>> l.reverse()>>> l['first', 'cc', 2, 2, 1]>>> sorted(l)[1, 2, 2, 'cc', 'first']>>> l['first', 'cc', 2, 2, 1]>>>
四、元组(tuple)
不可变序列
1.创建元组
>>> t1=(1,2,3) >>> t2=1,2,3, >>> t3='a', >>> t1 (1, 2, 3) >>> t2 (1, 2, 3) >>> t3 ('a',) #创建有一个元素的元组必须有逗号>>> single_tuple=(2)>>> single_tuple2>>> single_tuple=(2,)>>> single_tuple(2,)>>>
2.touple函数
>>> tuple([1,2,3]) (1, 2, 3) >>> tuple('abc') ('a', 'b', 'c') >>> tuple((1,2,3)) (1, 2, 3)
3.元组方法
- count
- index
五、字符串(不可变序列)
1.字符换基本操作
参见上面有关序列的操作.
2.格式化字符串
>>> print 'price:%s'%123 price:123 >>> print u'宽度示例:%f'%3.145926 宽度示例:3.145926 >>> print u'宽度精度示例:%16.2f'%3.145926 字段宽度和精度: 3.14 >>> print u'0可以填充不足位数:%16.2f'%3.145926 0可以填充不足位数: 3.14 >>> print u'0可以填充不足位数:%016.2f'%3.1415926 0可以填充不足位数:0000000000003.14 >>> print u'-表示左对齐:%10.2f'%3.1415926 -表示左对齐: 3.14 >>> >>> print u'-表示左对齐:%-10.2f'%3.1415926 -表示左对齐:3.14 >>> print u'空格表示正数前面加空格:% d'%-10+'\n'+u'空格表示正数前面加空格:% d'%5 空格表示正数前面加空格:-10 空格表示正数前面加空格: 5 >>> print u'空格表示正数前面加空格:%d'%-10+'\n'+u'空格表示正数前面加空格:%d'%5 空格表示整数前面加空格:-10 空格表示整数前面加空格:5 >>> print u'+表示无论正负都带着正负号:%+d'%-10+'\n'+u'+表示无论正负都带着正负号:%+d'%5 +表示无论正负都带着正负号:-10 +表示无论正负都带着正负号:+5 >>> print u'+表示无论正负都带着正负号:%+d'%-10+'\n'+u'+表示无论正负都带着正负号:%+d'%5 +表示无论正负都带着正负号:-10 +表示无论正负都带着正负号:+5
3.常用字符串方法
string.capitalize() 把字符串的第一个字符大写,其他小写>>> s'aJJKbcefzxwu'>>> s.capitalize()'Ajjkbcefzxwu' string.center(width) 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串 >>> s.center(20)' aJJKbcefzxwu ' string.count(str, beg=0, end=len(string)) 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 >>> s.count('J')2 string.decode(encoding='UTF-8', errors='strict') 以 encoding 指定的编码格式解码 string,如果出错默认报一个 ValueError 的 异 常 , 除 非 errors 指 定 的 是 'ignore' 或 者'replace' string.encode(encoding='UTF-8', errors='strict') 以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' string.endswith(obj, beg=0, end=len(string)) 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.>>> s.endswith('q')False string.find(str, beg=0, end=len(string)) 检测 str 是否包含在 string 中,如果 beg 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回-1>>> s.find('J')1>>> string.index(str, beg=0, end=len(string)) 跟find()方法一样,只不过如果str不在 string中会报一个异常.>>> s.index('q')Traceback (most recent call last): File "<stdin>", line 1, in <module>ValueError: substring not found>>> s.index('a')0 string.isalnum() 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False>>> s.isalnum()True>>> ss='2345'>>> ss.isalnum()True>>> '3232fsfsdf'.isalnum()True>>> sss="12_45">>> sss.isalnum()False string.isalpha() 如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False>>> sss.isalsss.isalnum( sss.isalpha(>>> sss.isalpha()False>>> ss.isalpha()False>>> s.isalpha()True string.isdigit() 如果 string 只包含数字则返回 True 否则返回 False.>>> sss.isdigit()False>>> ss.isdigit()True>>> s.isdigit()False string.islower() 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False>>> ssss='123abc'>>> ssss.islower()True string.isspace() 如果 string 中只包含空格,则返回 True,否则返回 False.>>> ' '.isspace()True>>> '1 '.isspace()False string.istitle() 如果 string 是标题化的(见 title())则返回 True,否则返回 False>>> 'Tjksskd'.istitle()True>>> 'Tjkss2kd'.istitle()False>>> 'Tjksskd'.istitle()True>>> 'TjkssFkd'.istitle()False string.isupper() 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False>>> 'AAAA_2323'.isupper()True>>> 'AAAAe_2323'.isupper()False string.join(seq) 以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串>>> '-'.join(['1','2','3','4'])'1-2-3-4' string.ljust(width) 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串 string.rjust(width) 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串>>> s.ljust(20)'aJJKbcefzxwu '>>> s.rjust(20)' aJJKbcefzxwu'>>> s.center(20)' aJJKbcefzxwu ' string.lower() 转换 string 中所有大写字符为小写.>>> 'AAAAbbbb'.lower()'aaaabbbb'>>> 'AAAAbbb12b'.lower()'aaaabbb12b' string.lstrip() 截掉 string 左边的空格string.rstrip() 删除 string 字符串末尾的空格.string.strip([obj]) 在 string 上执行 lstrip()和 rstrip()>>> ' fafsafs '.lstrip()'fafsafs '>>> ' fafsafs '.rstrip()' fafsafs'>>> ' fafsafs '.strip()'fafsafs' max(str) 返回字符串 str 中最大的字母。 min(str) 返回字符串 str 中最小的字母。>>> max(s)'z'>>> min(s)'J' string.rfind(str, beg=0,end=len(string) ) 类似于 find()函数,不过是从右边开始查找.>>> s'aJJKbcefzxwu'>>> s.rfind('J')2 string.rindex( str, beg=0,end=len(string)) 类似于 index(),不过是从右边开始. string.split(str="", num) 以 str 为分隔符切片 string,如果 num有指定值,则仅分隔 num次 >>> s2.split('-',3)['a', 'b', 'c', 'd-e-f']>>> s2.split('-',1)['a', 'b-c-d-e-f'] string.splitlines(keepends=False) 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。>>> test='a bc d\nfsfe\roopq'>>> test.splitlines()['a bc d', 'fsfe', 'oopq']>>> test.splitlines(True)['a bc d\n', 'fsfe\r', 'oopq']>>> string.startswith(obj, beg=0,end=len(string)) 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查. string.swapcase() 翻转 string 中的大小写>>> 'aAbBcC'.swapcase()'AaBbCc' string.title() 返回"标题化"的 string,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle())>>> 'aAbBcC'.title()'Aabbcc' string.upper() 转换 string 中的小写字母为大写>>> 'a12bcMM'.upper()'A12BCMM' string.zfill(width) 返回长度为 width 的字符串,原字符串 string 右对齐,前面填充0>>> s'aJJKbcefzxwu'>>> s.zfill(30)'000000000000000000aJJKbcefzxwu'