行銷人轉職爬蟲王實戰|5大社群+2大電商

1. 爬蟲新兵營 與 轉職爬蟲王 2. 進階皇蟲 Selenium 3. PTT 的消費者在意什麼 4. Dcard 爆點分析 5. Instagram 增粉大師 6. Youtube 中尋找KOL夥伴 7. FaceBook 自動文小幫手 8. 蝦皮市場預估-這個市場有多大? 9. Amazon 告訴你市場缺口 10. Gmail 自動寄信
課程介紹 & 程式碼

Html爬蟲Get實戰-全台最大美食平台FoodPanda爬蟲,把熊貓抓回家

FoodPanda是台灣現在最具知名的美食外送平台,他改變了整個消費者的飲食習慣,創造出一個獨特的線上通路,也讓商家的消費族群不再侷限於方圓一公里內。能爬下Foodpanda等於能夠了解當地的飲食習慣,對於要切入該市場的你,這是很具有參考價值的!

在學習完「Html爬蟲Get教學-Yahoo」課程以後,本篇文章將帶領您朝向下一個實戰。課程的可交付成果,是爬下地區的「店家名稱、評分、標籤、外送費用」,並將結果整理成CSV檔案,以便日後分析。

課程中首先利用figcaption這個特殊的標籤,抓下class名稱為vendor-info的資料,此舉能爬下所有店家的相關資料,後續只需要將此資料進行擷取,找出每家店的 「店家名稱、評分、標籤、外送費用」 即可。 行銷搬進大程式 利用span標籤的class名稱name抓下店家名稱

print(i.find('span',{'class':'name'}).text) #取得店家名稱

取得評分的部分(2023/4/3修改,因此與影片中程式碼不同),因為剛好評分的標籤為strong,正是資料中第一個出現的strong標籤,因此直接抓取strong標籤即可,甚至不需要任何的額外條件設定。

print(i.find('span',{'class':'rating--label-primary'}).text) #取得評分

每家店的標籤則是爬取li標籤中vendor-characteristic的這個class,這個class非常獨一無二,因此不須另外深入擷取,即可拿到我們想要的資料。

print(i.find('li',{'class':'vendor-characteristic'}).text) #取得標籤

費用則是爬取li標籤中的delivery-fee這個class(2023/4/3修改,因網站中將此資料移除,因此目前爬不到了),由於取得的資料位於li的strong標籤裏頭,因此採取兩步驟,第一個變數part1先取得li標籤內容,part2變數則是從li標籤中,取得strong標籤。

# 2023/4/3修改,因網站中將此資料移除,因此目前爬不到了,在完整程式碼中沒有以下程式
# 取得外送費用
print(i.find('li',{'class':'delivery-fee'}).text) # 2021/7/25修改
part1 = i.find('li',{'class':'delivery-fee'}) # 2021/7/25修改
part2 = part1.find({'strong'})
part2.text

作者:楊超霆 行銷搬進大程式 創辦人

©2023 行銷搬進大程式 Marketing Live in Code