可以直接作用于for
循环的数据类型有以下几种:
一类是集合数据类型,如list
、tuple
、dict
、set
、str
等;
一类是generator
,包括生成器和带yield
的generator function。
这些可以直接作用于for
循环的对象统称为可迭代对象:Iterable
。
可以使用isinstance()
判断一个对象是否是Iterable
对象:
from collections import Iterable def fib(max): n,a,b=0,0,1 while n<max: #print(b) yield b a,b = b,a+b n=n+1 return 'done' print(isinstance([],Iterable)) # True print(isinstance((),Iterable)) # True print(isinstance({},Iterable)) # True print(isinstance(set([]),Iterable)) # True print(isinstance('abc',Iterable)) # True print(isinstance((x for x in range(10)),Iterable)) # True print(isinstance(fib(10),Iterable)) # True print(isinstance(100,Iterable)) # False
而生成器不但可以作用于for
循环,还可以被next()
函数不断调用并返回下一个值,直到最后抛出StopIteration
错误表示无法继续返回下一个值了。
*可以被next()
函数调用并不断返回下一个值的对象称为迭代器:Iterator
。
可以使用isinstance()
判断一个对象是否是Iterator
对象:
from collections import Iterator def fib(max): n,a,b=0,0,1 while n<max: #print(b) yield b a,b = b,a+b n=n+1 return 'done' print(isinstance([],Iterator)) # False print(isinstance((),Iterator)) # False print(isinstance({},Iterator)) # False print(isinstance(set([]),Iterator)) # False print(isinstance('abc',Iterator)) # False print(isinstance((x for x in range(10)),Iterator)) # True print(isinstance(fib(10),Iterator)) # True print(isinstance(100,Iterator)) # False
生成器都是Iterator
对象,但list
、tuple
、dict
、set
、str等
虽然是Iterable
,却不是Iterator
。
把list
、tuple
、dict
、set
、str
等Iterable
变成Iterator
可以使用iter()
函数:
from collections import Iterator print(isinstance(iter([]),Iterator)) # True print(isinstance(iter(()),Iterator)) # True print(isinstance(iter({}),Iterator)) # True print(isinstance(iter(set([])),Iterator)) # True print(isinstance(iter('abc'),Iterator)) # True
你可能会问,为什么list
、tuple
、dict
、set
、str
等数据类型不是Iterator
?
这是因为Python的Iterator
对象表示的是一个数据流,Iterator对象可以被next()
函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration
错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()
函数实现按需计算下一个数据,所以Iterator
的计算是惰性的,只有在需要返回下一个数据时它才会计算。
Iterator
甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。
小结
凡是可作用于for
循环的对象都是Iterable
类型;
凡是可作用于next()
函数的对象都是Iterator
类型,它们表示一个惰性计算的序列;
集合数据类型如list
、tuple
、dict
、set
、str
等是Iterable
但不是Iterator
,不过可以通过iter()
函数获得一个Iterator
对象。
Python的for
循环本质上就是通过不断调用next()
函数实现的,例如:
for x in [1, 2, 3, 4, 5]: pass
实际上完全等价于:
# 首先获得Iterator对象: it = iter([1, 2, 3, 4, 5]) # 循环: while True: try: # 获得下一个值: x = next(it) except StopIteration: # 遇到StopIteration就退出循环 break
另外,在Python2.7中,range()生成一个列表,xrange()生成一个生成器。
在Python3.5中,range()直接生成一个生成器,xrange()没有了。
#python 2.7 >>> range(10) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>> type(range(10)) <type 'list'> >>> xrange(10) xrange(10) >>> type(xrange(10)) <type 'xrange'> #python 3.5 >>> range(10) range(0, 10) >>> type(range(10)) <class 'range'> >>> xrange(10) Traceback (most recent call last): File "<stdin>", line 1, in <module> NameError: name 'xrange' is not defined
文件也是一种迭代器Iterator
from collections import Iterable from collections import Iterator f=open('yesterday.txt',encoding='UTF-8') print(isinstance(f,Iterable)) #True print(isinstance(f,Iterator)) #True
来源:https://www.cnblogs.com/zhengna/p/9211871.html