Python 可迭代的對象與迭代器的對比
什么是迭代?迭代是指按需一次獲取一個數據。是否可以迭代,可以通過是否可以使用for循環取值來進行簡單的判斷。更準確的判斷是使用iter()函數,這是一個Python內置函數。
可迭代的對象
iter()函數的作用如下:
如果對象實現了__iter__方法,那么就調用它,獲取一個迭代器。比如:
- def __iter__(self):
- return SentenceIterator(self.words)
如果對象沒有實現__iter__但是實現了__getitem__方法,那么就創建一個迭代器,嘗試從索引0開始獲取元素。
如果嘗試獲取元素失敗,就會拋出TypeError異常。
可迭代的對象,就是使用iter()函數判斷,滿足前面2點的對象。
任何Python序列都是可以迭代的,因為它們都實現了__getitem__方法。
迭代器
從前面iter()函數的作用可以發現,迭代器是從可迭代的對象中獲取的。
如果對象本身是可迭代的,就調用__iter__方法獲取一個迭代器。
如果對象不可迭代但是實現了__getitem__方法,那么就會創建一個迭代器。
比如可以使用iter()函數把列表轉換為迭代器:
- >>> test_list = [1, 2, 3]
- >>> print(type(test_list))
- <class 'list'>
- >>> test_iter = iter(test_list)
- >>> print(type(test_iter))
- <class 'list_iterator'>
迭代器可以使用for循環遍歷:
- for x in test_iter:
- print(x)
也可以使用while循環遍歷:
- while True:
- try:
- print(next(test_iter))
- except StopIteration:
- del test_iter
- break
- next()函數用于獲取迭代器下一個元素。
- 沒有元素了,迭代器會拋出StopIteration異常。
標準的迭代器接口有兩個方法:
- __next__返回下一個元素。
- __iter__返回self,以便在應該使用可迭代對象的地方使用迭代器,比如for循環中。
- def __iter__(self):
- return self
迭代器的準確定義是:迭代器是這樣的對象,它實現了無參數的__next__方法,返回序列中的下一個元素;如果沒有元素了,那么拋出StopIteration異常。Python中的迭代器還實現了__iter__方法,因此迭代器也是可以迭代的。
最后,通過對比可以發現,可迭代對象的__iter__返回的是迭代器:
- def __iter__(self):
- return SentenceIterator(self.words)
迭代器的__iter__返回的是self:
- class SentenceIterator:
- def __iter__(self):
- return self
而且迭代器還需要有__next__方法。
從這一點就能清楚看出它們的區別了。
需要特別注意的是,可迭代的對象一定不能是自身的迭代器,也就是說,可迭代對象必須實現__iter__方法,但是不能實現__next__方法。否則會讓設計模式變得混亂不堪。
參考資料:
《流暢的Python》第14章 可迭代的對象、迭代器和生成器
https://www.runoob.com/python3/python3-iterator-generator.html