跳到主要內容

[Python] 關鍵字yield和return究竟有什麼不同?

學習Scrapy的過程中碰到 yeild 這個關鍵字,我使用Python快半年了,還真的是第一次遇到這個關鍵字,於是我花了點時間研究後,終於明白它的作用了,怕下次看到時忘記,所以用這篇文將yield這個關鍵字重點整理一下。

1. yield的核心目的:為了節省記憶體

如果想要印出0~100的平方時,我們可能會這樣寫。

powers = [x**2 for x in range(100)]

for x in powers:
    print(x)

但這樣有一個致命問題在於,必須把整個list都存放在記憶體中,100個元素可能還不成問題,但如果今天的對象是一百萬筆資料,記憶體可能會承受不了,程式就崩潰了。

接下來就會說明yield要如何節省記憶體,但在此之前,先來談談Python的生成器(generator)。

2. 什麼是生成器(generator)?

生成器是一個可迭代的物件,可以放在for迴圈的in前面,或者使用next()函數呼叫執行下一次迭代。

和列表的差別在於,生成器會保存上次紀錄,並只有在呼叫下一層迭代的時候才載入記憶體執行

所以將上面的例子改寫成生成器,結果是一樣的,卻可以防止超過記憶體,注意我用的是 ( 而不是 [

powers = (x**2 for x in range(100))

for x in powers:
    print(x)

3. 函數加入yield後不再是一般的函數,而被視作為生成器(generator)

呼叫函數後,回傳的並非數值,而是函數的生成器物件。

4. yield和return一樣會回傳值,不過yield會記住上次執行的位置

yield和return一樣都會回傳值並中斷在目前位置,但最大不同在於yield在下次迭代時會從上次迭代的下一行接續執行,一直執行到下一個yield出現,如果沒有下一個yield則結束這個生成器。而且接續上一個迭代前的變數不會改變,就是維持上次結束前的模樣。

這部分我們來看下面這個例子:

def yield_test(n):
    print("start n =", n)
    for i in range(n):
        yield i*i
        print("i =", i)

    print("end")

tests = yield_test(5)
for test in tests:
    print("test =", test)
    print("--------")

執行結果:

start n = 5
test = 0
--------
i = 0
test = 1
--------
i = 1
test = 4
--------
i = 2
test = 9
--------
i = 3
test = 16
--------
i = 4
end
  1. 從第10、11行看到呼叫yield_test()後回傳的不是一個數值,而是一個可迭代的生成器。
  2. 在第一次迭代時,印出了 "start n = 5",因為不在迴圈中,所以僅僅印出這一次。
  3. 進入迴圈中,第一次時 i=0,接著遇到yield並回傳 0*0 = 0,並回到主程序。
  4. 主程序的test接收到回傳的0,於是印出 "test = 0" 並印出 "--------",結束這次迭代。
  5. 接著進行第二次迭代,會從上次結束的下一行開始,因此印出 "i = 0"。
  6. 完成後又回到迴圈開始,這時 i=1,接著再次遇到yield並回傳 1*1 = 1,並回到主程序。
  7. 主程序的test接收到回傳的1,於是印出 "test = 1" 並印出 "--------",結束這次迭代。
  8. 其他次迭代依此類推,直到i=5跳出迴圈,印出 "end" 之後已經沒有yield了,生成器會返回一個error StopIteration (這邊沒有印出來),告訴主程序迭代已經結束了。
  9. 結束主程序。

看完上面例子後,應該會從原本朦朦朧朧到有點概念了吧,其實yield有點像偵錯模式的中斷點,只是多了中斷時回傳值而已。

5. next()呼叫下一次迭代,send(n)呼叫下一次迭代並傳遞參數

def test():
    print("start...")
    while True:
        throw = yield 10
        print("throw:", throw)

p = test()
print(next(p))
print("-----------")
print(next(p))
print("-----------")
print(g.send(7))
print("-----------")

執行結果:

start...
10
-----------
throw: None
10
-----------
throw: 7
10
-----------
  1. 建立一個可迭代生成器p。
  2. next()執行第一次迭代,印出 "start..." 並回傳 10,但注意throw在賦予值之前就被中斷了。
  3. next()執行第二次迭代,因為throw並沒有被沒有被賦予值,所以印出 "throw: None",接著回傳 10。
  4. send()傳入7,等同於在上次結束的位置填入7,因此 throw=7,印出 "throw: 7"。

順帶一提,第一次迭代不可以send任何數值進去,因為沒有上一個位置可以接收。

6. Python range小知識

在Python 2.X中,有分range和xrange兩種,range就像第一個例子,生成一個[0, 1, 2, ...]的list。xrange則像第二種例子,使用生成器減少記憶體消耗。

但在Python 3.X後range就等於xrange,使用type()檢查會知道已經是range型態了。

print(type(range(10)))   # <class 'range'>

如果開始學就是Python3.X,就不必在意這些細節,繼續放心地用range吧!

參考資料

Python 裡的 yield - 讓你簡單、快速瞭解 yield 的概念

python中yield的用法详解--最简单,最清晰的解释_mieleizhi0522的博客-CSDN博客_python yield

彻底理解Python中的yield

Python 的可迭代物件、迭代器和產生器


如果喜歡這篇文章,請訂閱我並且拍五下手給予回饋(使用Google或Facebook帳號免費登入,只需要30秒),資金由LikeCoin提供,完全不會花到各位半毛錢!

因為您的支持,我才更有動力創作出更優質的文章~

留言

這個網誌中的熱門文章

[遊記] 2022/07/22 南寮漁港、香山濕地

前言: 2022年的暑假,我來到新竹的工研院實習,因此有了兩個月好好探索這座陌生城市的機會。我在來之前就計畫好了,每周五要選一個地方去旅行,目標是在兩個月內把整個新竹玩透透! 來到了第三個禮拜,今天我約了新竹在地人的大學朋友,請他騎機車載我到處逛逛😆 不過因為他早上有事情,所以我們就約中午吃飯。中午我們去吃城隍廟附近的 阿桂羊牛雜 ,我點了朋友很推的 羊肉炒麵 ,這家的炒麵很特別,醬汁很濃稠,沙茶味很香~ 我點加辣但有點太辣了,下次可能點小辣就好。另外有附飲料和冷氣這點很加分。 (只顧跟朋友聊天,就忘記拍照了😂) 阿桂羊牛雜 羊肉炒麵 $100 推薦指數:4⭐ 吃完飯後,本來想去南寮漁港,但因為今天的太陽真的太大了! 所以朋友就提議先去 新竹巨城 吹冷氣,晚點再去南寮漁港。雖然已經來過巨城一次,但跟別人一起逛就是不太一樣。我們去逛了服飾店、書局和湯姆熊,不知不覺就三點了。於是就離開巨城前往南寮漁港囉~ 本來以為 南寮漁港 很遠,但騎機車一下子就到了,果然在新竹還是要有機車比較方便阿! 我們先去南寮漁港的遊客中心,展望台的景色很不錯,室內還有溜滑梯可以玩呢! 接著我們在附近的魚市場、國際風箏場等地方邊聊邊走,最後走到 魚鱗天梯 。 魚鱗天梯看起來的確很像魚鱗,但聽說他的功能其實是消波塊,還真酷! 底下就有一小片沙灘,因為我今天穿拖鞋,就有下去踩一下海水。不過這裡的海水沒很乾淨,上來後腳上全都是沙子,幸好旁邊就有可以洗腳的地方。 其實旁邊有個滿有名的 17公里海岸自行車道 ,不過我們比較晚才到,所以就沒租腳踏車去騎了。 接著就往南到 香山濕地 ,騎機車也是一下就到了。 香山濕地就像小型的高美濕地,一旁的 賞蟹步道 可以直接走在溼地上方。 賞蟹步道兩旁真的很多螃蟹,照片裡的白點都是螃蟹哦! 當時剛好碰上漲潮,於是我們就在步道上拍起縮時攝影,從影片中可見漲潮的速度有多快! 香山濕地也是看夕陽的好景點,只是有點太早來了,於是我們走去旁邊的 綠色隧道 ,等待夕陽下山。 最後終於等到夕陽了! 加上倒影還滿漂亮的,只可惜今天海面有點雲,無緣看到夕陽落到海平面之下的景色。 最後順路繞去附近的 青青草原 ,雖然天色已經暗了下來,不過因此溜滑梯都不用排隊,可以多溜了幾趟😁 我們也去看了一眼大草原,但因為傍晚有一堆蚊蟲,所以就趕緊撤退了! 最後晚餐去吃 蛋包飯 ,這家也是朋友推薦的...

[Python] 關於 with 你所不知道的事

相信用 C 語言寫過檔案讀取的人都知道,經常開檔後就忘記關檔,或者程式中間跳出例外,因此沒有關檔。這些問題常常讓人非常頭痛😱。 所幸 Python 中有 with 這個語法糖,可以自動幫你開關檔,跳出例外也難不倒他,真的非常好用。 但你真的了解 with 背後的運行原理嗎? 🤔 不知道沒關係,因為你現在就會知道了! context manager 在講 with 之前,必須先介紹一下 context manager ,中文可以翻成 情境管理器 。 為什麼叫做 情境管理器 呢? 我們試想一個情境… 當你進入房間時,就要開啟房間的燈:然後當你離開房間時,就要關閉房間的燈。 像這樣理所當然一定要做的事情,我們就稱為一個情境。而 Python 就是透過情境管理器處理這些情境。 要自己實作 context manager 其實很簡單,只要在 Class 中實作 __enter__() 和 __exit__() 即可。 就以進入房間當作例子。 class Room (): def turn_on_light ( self ): print ( "開燈" ) def turn_off_light ( self ): print ( "關燈" ) def __enter__ ( self ): print ( "進入房間" ) self.turn_on_light() return "在房間裡" def __exit__ ( self, exc_type, exc_value, traceback ): self.turn_off_light() print ( "離開房間" ) with Room() as room: ...

[Python] async def & await 重點整理

最近實習要用到 FastAPI ,我發現 FastAPI 的 path operation function 會使用 async def ,還會搭配使用 await ,因為對這兩個關鍵字沒很熟,所以就藉機紀錄一下,也避免之後忘記。 async def & await 使用情境 我直接利用下面這個例子來展示什麼情況下可以使用 async 和 await 。 import time def dosomething ( i ): print ( f"第 {i} 次開始" ) time.sleep( 2 ) print ( f"第 {i} 次結束" ) if __name__ == "__main__" : start = time.time() for i in range ( 5 ): dosomething(i+ 1 ) print ( f"time: {time.time() - start} (s)" ) 執行後應該會像這樣。 第 1 次開始 第 1 次結束 第 2 次開始 第 2 次結束 第 3 次開始 第 3 次結束 第 4 次開始 第 4 次結束 第 5 次開始 第 5 次結束 time: 10.048049688339233 (s) 這非常直覺,因為每次呼叫 dosomething() 時都會等待2秒,等完才會執行下一輪,所以最後執行總時間是10秒相當合理。 但仔細想想,如果那2秒是做網路請求或檔案讀寫(IO),這2秒是不需要CPU的,但CPU就只能發呆2秒,痴痴地等待回傳結果,其他什麼事都不能做,豈不是太浪費了嗎!? (學過作業系統的人就知道,絕對不能讓CPU發呆XD) 因此 Python 就有了 asyncio 這個工具,來徹底的利用(X) 榨乾(O) CPU的效能。 我把剛才的例子改成 asyncio 的版本。 import time import asy...