PTTç¬è²ï½ç¬ä¸å¨å°æå¤§é»åå¸åæ¬

ç¬è²çå¯äº¤ä»çµæå¦ä¸åæç¤ºï¼ç¸½å±åæ¬ä½ï¼

æç« ç·¨ç¢¼
ä½è
çå
åé¡
æ¨é¡
å§æ
æ¥æ
IPä½ç½®
ç¸½çè¨æ¸
å
æ¨
ä¸ç«
æç« åæ¸ï¼æ£-è² ï¼
ææçè¨

æå·²ç¶å°PPTç¬è²çåè½æåæ Ivan_ptt.py éåæªæ¡ï¼å æ¤ç¨å¼ç¢¼çæå¸é½æåç¹èå¦ä½ä½¿ç¨éè£é¢çæ¹æ³ crawl_ptt_page ã crawl_ptt_page ç¸½å±æä»¥ä¸å©ååæ¸ï¼

Board_Nameï¼æ³ç¬çæ¿åç¨±ï¼è±æï¼ã

page_numï¼æ³è¦ç¬å¹¾é çå§å®¹ï¼å¾ææ°çéå§ç¬ï¼ã å¨ç¯ä¾ä¸ç¬åPTTçå«å¦çï¼èå«å¦ççæ¿åçºãGossipingãï¼ç¶å¾å¾ææ°çé æ¸ç¬ä¸é ã

# ä½¿ç¨ç¯ä¾
gossip = crawl_ptt_page(Board_Name ='Gossiping' ,page_num= 1)

# ç¬è²å¯¦æ°ææ³
broad = ['folklore','womentalk','boy-girl','Urban_Plan','Gossiping','Nantou','TaichungBun']
containar = pd.DataFrame() # åæºåä¸åç©ºçå®¹å¨
for i in broad:
    Elephants = crawl_ptt_page(Board_Name =i ,page_num= 50)
    containar =pd.concat([containar,Elephants],axis=0) # ææ°ççµæåé²å®¹å¨

作者：楊超霆行銷搬進大程式創辦人

上一篇
爬蟲前的工具選擇｜我該怎麼選擇爬蟲的方式？

資料分析實戰｜利用PTT資料進行消費者關鍵字分析，消費者都在討論什麼？

行銷人轉職爬蟲王實戰｜5大社群＋2大電商

PTTç¬è²ï½ç¬ä¸å ¨å°æå¤§é»å­å¸åæ¬

PTTç¬è²ï½ç¬ä¸å¨å°æå¤§é»åå¸åæ¬