1. Html網頁結構介紹-網頁到底如何傳送資料?爬蟲必學
2. 資料傳遞:Get與Post差異,網路封包傳送的差異
3. Html爬蟲Get教學-抓下Yahoo股票資訊,程式交易的第一步
4. Html爬蟲Get實戰-全台最大美食平台FoodPanda爬蟲,把熊貓抓回家
5. 資料分析實戰,熊貓FoodPanda熱門美食系列|看出地區最火料理種類
6. Json爬蟲教學-Google趨勢搜尋|掌握最火關鍵字
7. Json爬蟲實戰-24小時電商PChome爬蟲|雖然我不是個數學家但這聽起來很不錯吧
8. Html爬蟲Post教學-台灣股市資訊|網韭菜們的救星
9. Html爬蟲Post實戰-全球美食平台UberEat爬蟲
10. Pandas爬蟲教學-Yahoo股市爬蟲|不想再盯盤
11. Pandas爬蟲實戰-爬下全台各地區氣象預報歷史資料
12. 資料分析實戰-天氣預報圖像化|一張圖巧妙躲過雨季
PTTæ¯å°ç£å°æ¸æ²æå©çåé«ä»å ¥ï¼çè«ä¸ï¼ç社群平å°ï¼èå §å®¹å¤ä»¥æååç¾ï¼å æ¤ååçæ¥ä¸»å¯ä»¥å¨PTTä¸æ¾å°ä¸å°èèªå·±åçæéçæ¶è²»è è¨è«ï¼æ¬æç« å°å¸¶é æ¨ç¬ä¸æ¨æå®çPTTçå §å®¹ï¼å¯ä»¥æå®è¦ç¬çãçãããé æ¸ãï¼ä¸¦ä¸å¾ææ°çæç« éå§ç¬åã
ç¬è²çå¯äº¤ä»çµæå¦ä¸åæ示ï¼ç¸½å ±åæ¬ä½ï¼
æå·²ç¶å°PPTç¬è²çåè½æå æ Ivan_ptt.py éåæªæ¡ï¼å æ¤ç¨å¼ç¢¼çæå¸é½æåç¹èå¦ä½ä½¿ç¨éè£é¢çæ¹æ³ crawl_ptt_page ã crawl_ptt_page ç¸½å ±æ以ä¸å ©ååæ¸ï¼
- Board_Nameï¼æ³ç¬çæ¿å稱ï¼è±æï¼ã
- page_numï¼æ³è¦ç¬å¹¾é çå §å®¹ï¼å¾ææ°çéå§ç¬ï¼ã å¨ç¯ä¾ä¸ç¬åPTTçå «å¦çï¼èå «å¦ççæ¿åçºãGossipingãï¼ç¶å¾å¾ææ°çé æ¸ç¬ä¸é ã
# 使ç¨ç¯ä¾
gossip = crawl_ptt_page(Board_Name ='Gossiping' ,page_num= 1)
ç¶æå實éå¨èéæ¶è²»è è³è¨çæåï¼éæ¼æ¨çåççè¨å¯è½ææ£å¸å¨ååçä¸ï¼å æ¤æ³è¦ç¬åå¤åçç話ï¼å°±å¿ é 使ç¨pandaså¥ä»¶ä¸ç concatä¾é²è¡è³æåä½µçåä½ï¼ä»¥å©ä¹å¾çè³æåæãå¦æéä¸ç¥éæåè³æå¦ä½åæç話ï¼å¯ä»¥åèãPythonå¹«ä½ èªååGoogle èªç¶èªè¨åæ ï¼é¡§å®¢å¨è¨è«ä»éº¼ï¼ â part3ãæç« ï¼è£¡é¢æ詳細ç解æèå享ï¼æè æ¯ç´æ¥ççãééµåæ¿ä»£æ¹æ¡ï¼æ¯è¼TF-IDFæ¼ç®æ³èGoogle NLPï¼èª°èçéï¼ã課ç¨ç實æ°æ¡ä¾å§ï¼
# ç¬è²å¯¦æ°æ
æ³
broad = ['folklore','womentalk','boy-girl','Urban_Plan','Gossiping','Nantou','TaichungBun']
containar = pd.DataFrame() # å
æºåä¸å空ç容å¨
for i in broad:
Elephants = crawl_ptt_page(Board_Name =i ,page_num= 50)
containar =pd.concat([containar,Elephants],axis=0) # ææ°ççµæåé²å®¹å¨
作者:楊超霆 行銷搬進大程式 創辦人