Python的迭代器和生成器怎么樣？

字號：小 中 大

    迭代器是訪問集合元素的一種方式。迭代器對象從集合的第一個元素開始訪問，直到所有的元素被訪問完結(jié)束。迭代器只能往前不會后退，不過這也沒什么，因為人們很少在迭代途中往后退。
    使用迭代器的優(yōu)點
    對于原生支持隨機訪問的數(shù)據(jù)結(jié)構(gòu)(如tuple、list)，迭代器和經(jīng)典for循環(huán)的索引訪問相比并無優(yōu)勢，反而丟失了索引值(可以使用內(nèi)建函數(shù)enumerate()找回這個索引值)。但對于無法隨機訪問的數(shù)據(jù)結(jié)構(gòu)(比如set)而言，迭代器是唯一的訪問元素的方式。
    另外，迭代器的一大優(yōu)點是不要求事先準(zhǔn)備好整個迭代過程中所有的元素。迭代器僅僅在迭代到某個元素時才計算該元素，而在這之前或之后，元素可以不存在或者被銷毀。這個特點使得它特別適合用于遍歷一些巨大的或是無限的集合，比如幾個G的文件，或是斐波那契數(shù)列等等。
    迭代器更大的功勞是提供了一個統(tǒng)一的訪問集合的接口，只要定義了__iter__()方法對象，就可以使用迭代器訪問。
    迭代器有兩個基本的方法
    next方法：返回迭代器的下一個元素
    __iter__方法：返回迭代器對象本身
    一、迭代器Iterators
    迭代器僅是一容器對象，它實現(xiàn)了迭代器協(xié)議。它有兩個基本方法：
    1)next方法
    返回容器的下一個元素
    2)__iter__方法
    返回迭代器自身
    迭代器可使用內(nèi)建的iter方法創(chuàng)建，見例子：
    >>> i = iter('abc')
    >>> i.next()
    'a'
    >>> i.next()
    'b'
    >>> i.next()
    'c'
    >>> i.next()
    Traceback (most recent call last):
    File "", line 1, in
    StopIteration:
    class MyIterator(object):
    def __init__(self, step):
    self.step = step
    def next(self):
    """Returns the next element."""
    if self.step==0:
    raise StopIteration
    self.step-=1
    return self.step
    def __iter__(self):
    """Returns the iterator itself."""
    return self
    for el in MyIterator(4):
    print el
    --------------------
    結(jié)果：
    3
    2
    1
    0
    二、生成器Generators
    從Python2.2起，生成器提供了一種簡潔的方式幫助返回列表元素的函數(shù)來完成簡單和有效的代碼。
    它基于yield指令，允許停止函數(shù)并立即返回結(jié)果。
    此函數(shù)保存其執(zhí)行上下文，如果需要，可立即繼續(xù)執(zhí)行。
    例如Fibonacci函數(shù)：
    def fibonacci():
    a,b=0,1
    while True:
    yield b
    a,b = b, a+b
    fib=fibonacci()
    print fib.next()
    print fib.next()
    print fib.next()
    print [fib.next() for i in range(10)]
    --------------------
    結(jié)果：
    1
    1
    2
    [3, 5, 8, 13, 21, 34, 55, 89, 144, 233]
    PEP Python Enhancement Proposal Python增強建議
    tokenize模塊
    >>> import tokenize
    >>> reader = open('c:/temp/py1.py').next
    >>> tokens=tokenize.generate_tokens(reader)
    >>> tokens.next()
    (1, 'class', (1, 0), (1, 5), 'class MyIterator(object):/n')
    >>> tokens.next()
    (1, 'MyIterator', (1, 6), (1, 16), 'class MyIterator(object):/n')
    >>> tokens.next()
    (51, '(', (1, 16), (1, 17), 'class MyIterator(object):/n')
    例子：
    def power(values):
    for value in values:
    print 'powering %s' %value
    yield value
    def adder(values):
    for value in values:
    print 'adding to %s' %value
    if value%2==0:
    yield value+3
    else:
    yield value+2
    elements = [1,4,7,9,12,19]
    res = adder(power(elements))
    print res.next()
    print res.next()
    --------------------
    結(jié)果：
    powering 1
    adding to 1
    3
    powering 4
    adding to 4
    7
    保持代碼簡單，而不是數(shù)據(jù)。
    注意：寧可有大量簡單的可迭代函數(shù)，也不要一個復(fù)雜的一次只計算出一個值的函數(shù)。
    例子：
    def psychologist():
    print 'Please tell me your problems'
    while True:
    answer = (yield)
    if answer is not None:
    if answer.endswith('?'):
    print ("Don't ask yourself too much questions")
    elif 'good' in answer:
    print "A that's good, go on"
    elif 'bad' in answer:
    print "Don't be so negative"
    free = psychologist()
    print free.next()
    print free.send('I feel bad')
    print free.send("Why I shouldn't ?")
    print free.send("ok then i should find what is good for me")
    --------------------
    結(jié)果：
    Please tell me your problems
    None
    Don't be so negative
    None
    Don't ask yourself too much questions
    None
    A that's good, go on
    None
    雖然很早之前就接觸yield這個詞了，卻一直是一知半解。趁現(xiàn)在有時間，把它研究一通再說。
    含有yield的函數(shù)說明它是一個生成器，而不是普通的函數(shù)。當(dāng)程序運行到y(tǒng)ield這一行時，該函數(shù)會返回值，并保存當(dāng)前域的所有變量狀態(tài);等到該函數(shù)下一次被調(diào)用時，會從上一次中斷的地方開始執(zhí)行，一直遇到下一個yield, 程序返回值, 并在此保存當(dāng)前狀態(tài); 如此反復(fù)，直到函數(shù)正常執(zhí)行完成。
    我一開始還想不明白調(diào)用者與生成器之間的函數(shù)堆棧是怎么做到的，后來才大悟原來是用到了'協(xié)程'這個原理。協(xié)程可視為微線程，下面會結(jié)合例子來說明一下yield及協(xié)程的運行過程。假設(shè)定義了test方法:
    [python]
    def test(len):
    i = 0
    while i < len :
    yield i
    i += 1
    我們來調(diào)用它看看輸出:
    >>> for i in test(5):
    print i
    輸出:
    這場景是不是很類似 for i in xrange(len); 是的, xrange就是這么干的。 for .. in 的操作實際上是調(diào)用了生成器的next()方法，以上的調(diào)用過程可以等價為:
    [python]
    f = test(5)
    print f.next()
    print f.next()
    print f.next()
    print f.next()
    print f.next()
    輸出結(jié)果與上次輸出一致。
    另外，在這次調(diào)用過程中，協(xié)程被創(chuàng)建了一次，被喚醒了5次(通過next)，被掛起了5次(通過yield), 最后協(xié)程退出并銷毀。大概就這些點了，有更深的理解再做補充。
    生成器(Generator)
    如果列表元素可以按照某種算法推算出來，那我們是否可以在循環(huán)的過程中不斷推算出后續(xù)的元素呢?這樣就不必創(chuàng)建完整的list，從而節(jié)省大量的空間。在Python中，這種一邊循環(huán)一邊計算的機制，稱為生成器(Generator)。
    要創(chuàng)建一個generator，有很多種方法。第一種方法很簡單，只要把一個列表生成式的[]改成()，就創(chuàng)建了一個generator：
    >>> L = [x * x for x in range(10)]
    >>> L
    [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
    >>> g = (x * x for x in range(10))
    >>> g
    at 0x104feab40>
    創(chuàng)建L和g的區(qū)別僅在于最外層的[]和()，L是一個list，而g是一個generator。
    我們可以直接打印出list的每一個元素，但我們怎么打印出generator的每一個元素呢?
    如果要一個一個打印出來，可以通過generator的next()方法：
    >>> g.next()
    0
    >>> g.next()
    1
    >>> g.next()
    4
    >>> g.next()
    9
    >>> g.next()
    16
    >>> g.next()
    25
    >>> g.next()
    36
    >>> g.next()
    49
    >>> g.next()
    64
    >>> g.next()
    81
    >>> g.next()
    Traceback (most recent call last):
    File "", line 1, in
    StopIteration
    我們講過，generator保存的是算法，每次調(diào)用next()，就計算出下一個元素的值，直到計算到最后一個元素，沒有更多的元素時，拋出StopIteration的錯誤。
    當(dāng)然，上面這種不斷調(diào)用next()方法實在是太變態(tài)了，正確的方法是使用for循環(huán)，因為generator也是可迭代對象：
    >>> g = (x * x for x in range(10))
    >>> for n in g:
    ... print n
    ...
    所以，我們創(chuàng)建了一個generator后，基本上永遠(yuǎn)不會調(diào)用next()方法，而是通過for循環(huán)來迭代它。
    generator非常強大。如果推算的算法比較復(fù)雜，用類似列表生成式的for循環(huán)無法實現(xiàn)的時候，還可以用函數(shù)來實現(xiàn)。
    比如，著名的斐波拉契數(shù)列(Fibonacci)，除第一個和第二個數(shù)外，任意一個數(shù)都可由前兩個數(shù)相加得到：
    1, 1, 2, 3, 5, 8, 13, 21, 34, ...
    斐波拉契數(shù)列用列表生成式寫不出來，但是，用函數(shù)把它打印出來卻很容易：
    def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
    print b
    a, b = b, a + b
    n = n + 1
    上面的函數(shù)可以輸出斐波那契數(shù)列的前N個數(shù)：
    >>> fib(6)
    仔細(xì)觀察，可以看出，fib函數(shù)實際上是定義了斐波拉契數(shù)列的推算規(guī)則，可以從第一個元素開始，推算出后續(xù)任意的元素，這種邏輯其實非常類似generator。
    也就是說，上面的函數(shù)和generator僅一步之遙。要把fib函數(shù)變成generator，只需要把print b改為yield b就可以了：
    def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
    yield b
    a, b = b, a + b
    n = n + 1
    這就是定義generator的另一種方法。如果一個函數(shù)定義中包含yield關(guān)鍵字，那么這個函數(shù)就不再是一個普通函數(shù)，而是一個generator：
    >>> fib(6)
    這里，最難理解的就是generator和函數(shù)的執(zhí)行流程不一樣。函數(shù)是順序執(zhí)行，遇到return語句或者最后一行函數(shù)語句就返回。而變成generator的函數(shù)，在每次調(diào)用next()的時候執(zhí)行，遇到y(tǒng)ield語句返回，再次執(zhí)行時從上次返回的yield語句處繼續(xù)執(zhí)行。
    舉個簡單的例子，定義一個generator，依次返回數(shù)字1，3，5：
    >>> def odd():
    ... print 'step 1'
    ... yield 1
    ... print 'step 2'
    ... yield 3
    ... print 'step 3'
    ... yield 5
    ...
    >>> o = odd()
    >>> o.next()
    step 1
    1
    >>> o.next()
    step 2
    3
    >>> o.next()
    step 3
    5
    >>> o.next()
    Traceback (most recent call last):
    File "", line 1, in
    StopIteration
    可以看到，odd不是普通函數(shù)，而是generator，在執(zhí)行過程中，遇到y(tǒng)ield就中斷，下次又繼續(xù)執(zhí)行。執(zhí)行3次yield后，已經(jīng)沒有yield可以執(zhí)行了，所以，第4次調(diào)用next()就報錯。
    回到fib的例子，我們在循環(huán)過程中不斷調(diào)用yield，就會不斷中斷。當(dāng)然要給循環(huán)設(shè)置一個條件來退出循環(huán)，不然就會產(chǎn)生一個無限數(shù)列出來。
    同樣的，把函數(shù)改成generator后，我們基本上從來不會用next()來調(diào)用它，而是直接使用for循環(huán)來迭代：
    >>> for n in fib(6):
    ... print n
    ...
    小結(jié)
    generator是非常強大的工具，在Python中，可以簡單地把列表生成式改成generator，也可以通過函數(shù)實現(xiàn)復(fù)雜邏輯的generator。
    要理解generator的工作原理，它是在for循環(huán)的過程中不斷計算出下一個元素，并在適當(dāng)?shù)臈l件結(jié)束for循環(huán)。對于函數(shù)改成的generator來說，遇到return語句或者執(zhí)行到函數(shù)體最后一行語句，就是結(jié)束generator的指令，for循環(huán)隨之結(jié)束。

Python的迭代器和生成器怎么樣？

字號： 小 中 大

字號：小中大