跳到主要內容

[2021 IT鐵人賽] Day 13:Python基本介紹06 | 函數、讀寫檔案、引用

早安安! 今天是Python基本介紹的最後一天了~ 6天真的太短了,有好多東西想講但都講不完 ಥ⌣ಥ,因此我打算今天就把幾個之後爬蟲會用到的幾個技巧介紹完,內容可能有點雜,請多見諒。

函數(Function)

函數最基礎的定義就是:給定一個輸入x,經過function後,得到一個輸出f(x)。

大家國中學過的一元多項式,就是一個簡單的函數,舉例:

y = x2 + 2x + 1

這是一個一元二次的多項式,如果我們x代入2,y就等於22+2*2+1 = 9,也可以寫成函數形式f(2) = 9。

了解完函數後,其實Python的函數也差不了太多,也是一個輸出得到一個輸入,只是輸入跟輸出的型態更自由了!

Python中使用def宣告函數,後面接函數名稱以及參數。

並使用函數名稱(參數1, 參數2, ...)呼叫參數。

那麼,請你告訴我,底下這個算不算是一個函數呢?

def hello():
    print("Hello, World!")

hello()

執行結果:

Hello, World!

這當然也是函數囉,只不過沒有輸出和輸入,單純印出 “Hello World” 而已。

順帶一提,因為Python是直譯式語言,是從頭開始直譯下來的,所以函數一定要定義在呼叫前面哦!

我們試著輸入參數:

def greet(name):
    print(f"Hello, {name}!")

greet("Andy")

執行結果:

Hello, Andy!

這邊我們傳入字串"Andy"作為參數name,於是在函數中印出 “Hello, Andy!”。

這次寫個函數,輸入兩個數字,回傳兩個數字的總和:

def sum(x, y):
    return x+y
    
print(sum(1, 2))

結果:

3

Python使用return作為函式的回傳,讀到return後就會跳出函數了並回傳數值。所以上面例子,我們傳入1和2,最後函數就回傳1+2 = 3。

使用時機是將重複性高的工作寫成函數,可以大大提升程式碼的重用性和精簡度。

讀寫檔案(I/O)

Python讀寫檔案使用open()這個函數,語法為open(檔案名稱, 模式)

file = open("demo_en.txt", "r")

檔案名稱沒有特別寫的話就是相對位置,起始位置為程式所在的資料夾,寫完整路徑的話就是絕對位置。

模式主要有三種,讀(r)、寫(w)、添加(a),以及二進位模式。

  • r:唯讀模式,只能讀取檔案
  • w:寫入模式,如果檔案不存在會建立新檔,如果存在則覆蓋掉之前的內容。
  • a:添加模式,如果檔案不存在會建立新檔,如果存在則添加在之前的內容之後。
  • rb、wb、ab:加上b後就是二進位模式,通常用於讀取圖片。

如果檔案中有中文字,則要將編碼設定成utf-8,否則會出錯。

file = open("demo_ch.txt", "r", encoding="utf-8")

開始檔案後使用read()函數讀取所有內容。

別忘了檔案操作完後一定要關檔哦,不關會導致更改沒有存檔,而且也浪費了記憶體。關檔用到close()函數。

file = open("demo_en.txt", "r")

content = file.read()
print(content)

file.close()

另外,readlines()可以依照行讀取整個檔案,回傳是一個List,每一個element就是一行字。

file = open("demo_en.txt", "r")

lines = file.readlines()
print(lines)

file.close()

執行結果:

['Country road, take me home\n', 'To the place I belong\n', 'West Virginia, mountain mamma']

我發現歌詞中少了一句,所以我要用添加模式(a)+write()函數補上漏掉的那一句。

file = open("demo_en.txt", "a")

file.write("Take me home, country road\n")

file.close()

如果常常忘記關檔怎麼辦,Python有提供with的寫法,離開範圍是就會自動關檔了,是不是很貼心呢! 我個人也比較建議這個寫法。

with open("demo_en.txt", "r") as file:
    content = file.read()
    print(content)

引用(import)

前面有提到,Python之所以受歡迎,很大的原因是因為他擁有廣大的社群,提供非常多的套件和資源可以使用,你如果夠厲害也可以自己寫套件回饋給社群,而我們現在就要學怎麼使用這些套件。

Python本身內建就包含很多套件了,另外Anaconda本身也預先載好了很多常用的套件,如果還是沒有你要的,還是可以使用Python的套件管理工具(pip)進行安裝。

只要 import+模組名稱 就可以在程式碼中使用了,我們這邊先拿內建就有的math套件做例子,使用math套件中的log()函數取1024以2為底的log:

import math
print(math.log(1024, 2)) # 10

你可能覺得寫math太麻煩,可以用 as 改成縮寫。

import math as m
print(m.log(1024, 2))

或者你不想要引用整個套件,你只想要引用math套件中的log()函數而已,可以用 from 的方式寫。

from math import log
print(log(1024, 2))

之後爬蟲會用到很多套件,到時候再一一做介紹。

小結

今天是Python基礎介紹的最後一天,我整理了幾個之後專案會用到的重點,像是函數、讀寫檔案、引用,希望能快速讓你對Python有點認識。

前幾天都在介紹Python多少覺得有點悶(我自己也寫得很悶),不過別擔心,明天我們就要開始進入文章的重頭戲 - 網頁爬蟲!! 想學網頁爬蟲的朋友千萬別錯過明天我要和你分享的內容囉~


如果喜歡這系列文章麻煩幫我按Like加訂閱,你的支持是我創作最大的動力~

本系列文章以及範例程式碼都同步更新在GitHub上,後續會持續的更新,如果喜歡也麻煩幫我按個星星吧~

有任何問題或建議,都歡迎在底下留言區提出,還請大家多多指教。


如果喜歡這篇文章,請訂閱我並且拍五下手給予回饋(使用Google或Facebook帳號免費登入,只需要30秒),資金由LikeCoin提供,完全不會花到各位半毛錢!

因為您的支持,我才更有動力創作出更優質的文章~

留言

這個網誌中的熱門文章

[遊記] 2022/07/22 南寮漁港、香山濕地

前言: 2022年的暑假,我來到新竹的工研院實習,因此有了兩個月好好探索這座陌生城市的機會。我在來之前就計畫好了,每周五要選一個地方去旅行,目標是在兩個月內把整個新竹玩透透! 來到了第三個禮拜,今天我約了新竹在地人的大學朋友,請他騎機車載我到處逛逛😆 不過因為他早上有事情,所以我們就約中午吃飯。中午我們去吃城隍廟附近的 阿桂羊牛雜 ,我點了朋友很推的 羊肉炒麵 ,這家的炒麵很特別,醬汁很濃稠,沙茶味很香~ 我點加辣但有點太辣了,下次可能點小辣就好。另外有附飲料和冷氣這點很加分。 (只顧跟朋友聊天,就忘記拍照了😂) 阿桂羊牛雜 羊肉炒麵 $100 推薦指數:4⭐ 吃完飯後,本來想去南寮漁港,但因為今天的太陽真的太大了! 所以朋友就提議先去 新竹巨城 吹冷氣,晚點再去南寮漁港。雖然已經來過巨城一次,但跟別人一起逛就是不太一樣。我們去逛了服飾店、書局和湯姆熊,不知不覺就三點了。於是就離開巨城前往南寮漁港囉~ 本來以為 南寮漁港 很遠,但騎機車一下子就到了,果然在新竹還是要有機車比較方便阿! 我們先去南寮漁港的遊客中心,展望台的景色很不錯,室內還有溜滑梯可以玩呢! 接著我們在附近的魚市場、國際風箏場等地方邊聊邊走,最後走到 魚鱗天梯 。 魚鱗天梯看起來的確很像魚鱗,但聽說他的功能其實是消波塊,還真酷! 底下就有一小片沙灘,因為我今天穿拖鞋,就有下去踩一下海水。不過這裡的海水沒很乾淨,上來後腳上全都是沙子,幸好旁邊就有可以洗腳的地方。 其實旁邊有個滿有名的 17公里海岸自行車道 ,不過我們比較晚才到,所以就沒租腳踏車去騎了。 接著就往南到 香山濕地 ,騎機車也是一下就到了。 香山濕地就像小型的高美濕地,一旁的 賞蟹步道 可以直接走在溼地上方。 賞蟹步道兩旁真的很多螃蟹,照片裡的白點都是螃蟹哦! 當時剛好碰上漲潮,於是我們就在步道上拍起縮時攝影,從影片中可見漲潮的速度有多快! 香山濕地也是看夕陽的好景點,只是有點太早來了,於是我們走去旁邊的 綠色隧道 ,等待夕陽下山。 最後終於等到夕陽了! 加上倒影還滿漂亮的,只可惜今天海面有點雲,無緣看到夕陽落到海平面之下的景色。 最後順路繞去附近的 青青草原 ,雖然天色已經暗了下來,不過因此溜滑梯都不用排隊,可以多溜了幾趟😁 我們也去看了一眼大草原,但因為傍晚有一堆蚊蟲,所以就趕緊撤退了! 最後晚餐去吃 蛋包飯 ,這家也是朋友推薦的...

[Python] async def & await 重點整理

最近實習要用到 FastAPI ,我發現 FastAPI 的 path operation function 會使用 async def ,還會搭配使用 await ,因為對這兩個關鍵字沒很熟,所以就藉機紀錄一下,也避免之後忘記。 async def & await 使用情境 我直接利用下面這個例子來展示什麼情況下可以使用 async 和 await 。 import time def dosomething ( i ): print ( f"第 {i} 次開始" ) time.sleep( 2 ) print ( f"第 {i} 次結束" ) if __name__ == "__main__" : start = time.time() for i in range ( 5 ): dosomething(i+ 1 ) print ( f"time: {time.time() - start} (s)" ) 執行後應該會像這樣。 第 1 次開始 第 1 次結束 第 2 次開始 第 2 次結束 第 3 次開始 第 3 次結束 第 4 次開始 第 4 次結束 第 5 次開始 第 5 次結束 time: 10.048049688339233 (s) 這非常直覺,因為每次呼叫 dosomething() 時都會等待2秒,等完才會執行下一輪,所以最後執行總時間是10秒相當合理。 但仔細想想,如果那2秒是做網路請求或檔案讀寫(IO),這2秒是不需要CPU的,但CPU就只能發呆2秒,痴痴地等待回傳結果,其他什麼事都不能做,豈不是太浪費了嗎!? (學過作業系統的人就知道,絕對不能讓CPU發呆XD) 因此 Python 就有了 asyncio 這個工具,來徹底的利用(X) 榨乾(O) CPU的效能。 我把剛才的例子改成 asyncio 的版本。 import time import asy...

[2021 IT鐵人賽] Day 23:專案05 - KKBOX風雲榜02 | AJAX

昨天已經找到的KKBOX用來傳資料的API,也知道各個參數的意義了,今天就實際將資料抓下來吧! 歌曲資訊 回到昨天那個API,是用JSON格式傳遞資料,資料的格式大致如下: 我們可以發現新歌的資料都放在 “newrelease” 之下,一個element就是一首歌的資訊,另外,每首歌的資訊也以key:value的形式整理的很清楚。 接著,就用之前教過的 requests.get(url) 直接取得API回傳的資料,但回傳的型態是json字串,所以再用Python本身內建的 json.loads() 函數轉成Python的list和dict資料型態。 # KKBOX華語新歌日榜 url = "https://kma.kkbox.com/charts/api/v1/daily?category=297&lang=tc&limit=50&terr=tw&type=newrelease" # 取得歌曲資訊json檔 response = requests.get(url) # 將json字串轉為Python的字典型態 data = json.loads(response.text) 既然已經轉成list和dict的型態了,再根據剛才觀察API得知的架構,要篩選資料就非常簡單,直接來看程式碼: song_list = data[ "data" ][ "charts" ][ "newrelease" ] # 取得每首歌的排名、曲名、連結、作者、時間 for song in song_list: song_rank = song[ "rankings" ][ "this_period" ] song_name = song[ "song_name" ] song_url = song[ "song_url" ] song_artist = song[ "artist_name"...