將會學到如何透過 Python 與 Selenium 編寫爬蟲程式來取得靜態與動態網頁上的資訊。 課程包含網頁架構、 PTT、新聞 與 PChome 爬蟲實作。 除此之外也會帶大家使用 Plot.ly 視覺化所取得的資料,並進行初步的資料清洗、前處理與資料分析。
(1)Python 爬蟲教學
(2)資料視覺化教學
(3)資料分析基礎
課程大綱
Week 1 Basic Web Crawler
(1)Introduction to Crawler
(2)Web Structure & HTTP
(3)Requests & Requests-HTML Package
Week 2 Advanced Web Crawler
(1)Selenium
(2)Pyspider
Week 3 Data Visualization
(1)API and Open Data
(2)Pandas Tutorial
(3)Plotly Tutorial
Week 4 Data Analysis
(1)Exploratory Data Analysis (EDA)
(2)Data Preprocessing
(3)Basic Data Mining
適合對象
本課程不包含 Python 基礎語法教學,適合對 Python 已有基礎使用經驗,想進一步學習如何透過爬蟲擷取網頁資料,進行資料視覺化與初步數據分析者