行銷人轉職爬蟲王實戰｜5大社群＋2大電商

課程介紹 & 程式碼

1. ç°å¢æºå

1. Seleniumçæ¬ç½®æ

3. Chromedriver

2. Seleniumå¸¸ç¨æ¹æ³æ´ç

3. By.LINK_TEXT

5. By.CSS_SELECTOR

7. By.CLASS_NAME

Seleniumä»ç´¹ï½Pythonç¬åæç¶²é çå©å¨

è¿å¹´ä¾ç¶²ç«åç«¯ççæå¤§å¹æ¹è®ï¼èªå¾FaceBookèèµ·ï¼åæç¶²ç«ä¹é¨ä¹èèµ·ï¼å¸¸è¦çåæç¶²ç«æFaceBookãDcardãIGãYoutubeççãå¯ä»¥èªªç¾å¨ç¥åçç¤¾ç¾¤å¹³å°é½æ¯ç¨åæçæ¹å¼åè¨è¨ï¼éæ¨£çå¥½èæ¯å¯ä»¥è®ä½¿ç¨èä¸æ·å°å¨ç¶²é å§çè¦½ï¼ä½éå°æ¼ç¶²è·¯ç¬è²ä¾èªªï¼å°±ç¸ç¶çéº»ç©ï¼æ©æçç¬è²é½æ¯ä¸æ¬¡æ§å°è¼å¥ç¶²é å§çææç¨å¼ç¢¼ï¼ä½ç¶è®æåææï¼ä¸å®è¦æ»¾è¼ªæ»¾å°åºææè§¸ç¼æ°çè³æè¿ä¾ï¼å°è´ç¬è²æ²æè¾¦æ³ç¬å°ã

åå¸ Seleniumç¬è²å¯ä»¥è§£æ±ºåæç¶²ç«çç¬è²åé¡ï¼ç°¡å®ä¾èªªå°±æ¯æ¨¡æ¬ä½¿ç¨èå¨çè¦½ç¶²é çè¡çºï¼å æ¤ä¹è½å¤ èç±ä¸äºèª¿æ´ä¾å½è£æçäººãä»¥ä¸æ¯å¨ãIGå¢ç²æ©å¨äººï½è¿½è¹¤è«åå¶å¦çå¢å å¦ï¼ãèª²ç¨ä¸ä½¿ç¨Seleniumç¬è²çå¯¦ä½ï¼å¯ä»¥çå°ç¶²é ä¸é äººä¾æ§å¶ï¼èªåçé»ææéã

1. ç°å¢æºå

1. Seleniumçæ¬ç½®æ

èªå¾Seleniumåç´å°4ä»¥å¾ï¼ç°å¢çé¨åä¹å¯ä»¥èªåä¸è¼ï¼å æ¤ä»¥ä¸å©åæéçç°å¢æªæ¡ä¹ä¸ä¸å®è¦ä¸è¼ï¼ä½è¥æ¯4ä¹åççæ¬ï¼ä»éè¦ä½¿ç¨ä»¥ä¸å©åæªæ¡ãæ¬æç« ä¹ä¾ç§æ°çSelenium 4é²è¡ä»ç´¹ï¼å æ¤ä»¥ä¸ç¨å¼ç¢¼ççºSelenium 4æä½¿ç¨ã

2. Phantomjs

phantomjsæ¯Seleniumçæ§å¶å¨ï¼çæ¼æ¯å°pythonç¨å¼ç¢¼è®ææ©å¨äººçå·¥å·ãSeleniumä¹æä»¥è½ç¬å°è¨±å¤ç¬è²ç¬ä¸å°çç¶²ç«ï¼å°±æ¯å çºSeleniumæ¯æ¨¡ä»¿äººçè¡çºï¼ççæéä¸åçè¦½å¨ï¼ä¸åå³çµ±çç¬è²ï¼ç´æ¥è«æ±å°åä¸ä¾è§£æãç¶ç¶éåææç¼ºé»Seleniumçå·è¡æçç¸å°å°±å·®å¾å¤ï¼ä½é¢å°IGéç¨®ãåæå¼ãçç¶²ç«ï¼å¿é è¦ç¨Seleniumæè½éçå°ã

phantomjs å¯ä»¥å°ãDownload PhantomJSãä¸ä¸è¼ï¼ä¾ç§èªå·±çä½æ¥ç³»çµ±é²è¡é¸æå³å¯ãä¸åç³»çµ±ï¼åç¤ºå¯è½æä¸å¤ªä¸æ¨£ï¼ä½ä¸å½±é¿åè½ï¼è®èä¸å¿éåº¦æå¿ã

3. Chromedriver

åå¸ Selenium éå¸¸æéåchromedriverå·¥å·ï¼chromedriveræ¯å°éçµ¦ç¨å¼æ§å¶ççè¦½å¨ãå æ¤å¯¦ä½æï¼ç¨å¼æå¹«æ¨éåä¸åchromeçè¦½å¨ï¼ä¸¦ä¸æç§ç¨å¼èªåææéï¼ç¶ç¶ä¹å¯ä»¥äººå·¥ä»å¥æä½ãç±æ¼chromedriveréè¦éåæ¨èªå·±çGoogle Chromeçæ¬ï¼è¥ä¸ç¥éæéº¼æ¥è©¢èªå·±çGoogle Chromeçæ¬ï¼å¯ä»¥é»ã Google Chromeçæ¬æ¥è©¢ãï¼è£¡é¢æåè¨´ä½ æè©²è¦ä¸è¼åªåçæ¬ï¼ç¢ºå®å¾å³å¯é»ä¸æ¹é¸æä¸è¼æªæ¡ã

2. Seleniumå¸¸ç¨æ¹æ³æ´ç

1. By.ID

æ ¹ææ¨ç±¤çIDä¾é²è¡ç¬è²ã

htmlç¯ä¾ï¼

<div id='test'>éåæ¯ç¯ä¾</div>

pythonç¯ä¾ï¼

driver.find_element(by=By.ID, value='test')

2. By.NAME

æ ¹ææ¨ç±¤çnameä¾é²è¡ç¬è²ã

htmlç¯ä¾ï¼

<div name='test'>éåæ¯ç¯ä¾</div>

pythonç¯ä¾ï¼

driver.find_element(by=By.NAME, value='nameåç¨±')

3. By.LINK_TEXT

æ ¹æè©²æ¨ç±¤æé¡¯ç¤ºçæåä¾é²è¡ç¬è²ã

htmlç¯ä¾ï¼

<div>éåæ¯ç¯ä¾</div>

pythonç¯ä¾ï¼

driver.find_element(by=By.LINK_TEXT , value='éåæ¯ç¯ä¾')

4. By.TAG_NAME

ééæ¨ç±¤é²è¡ç¬è²ã

htmlç¯ä¾ï¼

<h1>éåæ¯ç¯ä¾</h1>

pythonç¯ä¾ï¼

driver.find_element(by=By.TAG_NAME , value='h1')

5. By.CSS_SELECTOR

æ ¹æstyleé²è¡ç¬è²ã

htmlç¯ä¾ï¼

<div class='test'>éåæ¯ç¯ä¾</div>

pythonç¯ä¾ï¼

driver.find_element(by=By.CSS_SELECTOR , value='div.test')

6. By.XPATH

ä¾ç§ç¶²é åç«¯ç¨å¼ç¢¼é²è¡ç¬è²ï¼è¥æå¯«éç¶²é åç«¯ï¼è¼å®¹æäºè§£æ¤æ¹æ³ã

htmlç¯ä¾ï¼

<div class='test'>
    <div>
        <p>éæ¯ç¬¬ä¸æ®µæå</p>
    </div>
</div>

pythonç¯ä¾ï¼

driver.find_element(by=By.XPATH , value='//div[@class="test"]/div/p')

7. By.CLASS_NAME

æ ¹æclassä¾é²è¡ç¬è²ï¼å çºclasså¨ç¶²é è¨è¨ä¸ä¸¦éå¯ç¨ï¼å æ¤å¸¸å¸¸æç¬å°åå¾è³æã

htmlç¯ä¾ï¼

<div class='test'>éåæ¯ç¯ä¾</div>

pythonç¯ä¾ï¼

driver.find_element(by=By.CLASS_NAME, value='test')

äºè§£äºSeleniumä»¥å¾ï¼æåå°±æ¥ä¸ä¾ãSeleniumç°å¢è¨å®èæ¸¬è©¦ãèª²ç¨ï¼éå§é²è¡Seleniumå¯¦ä½å§ï¼

作者：楊超霆行銷搬進大程式創辦人

上一篇
資料分析實戰－天氣預報圖像化｜一張圖巧妙躲過雨季

Selenium環境設定與測試｜手把手教您如何設定 phantomjs與 chromedriver

©2023 行銷搬進大程式 Marketing Live in Code

Gmail商業合作 Youtube訂閱 Github程式碼 Medium追蹤 FB粉絲團追蹤