這是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,想要從事機(jī)器學(xué)習(xí)、人工智能、數(shù)據(jù)挖掘等前沿技術(shù),都離不開(kāi)數(shù)據(jù)跟蹤,本課程通過(guò)Numpy、Pandas進(jìn)行數(shù)據(jù)科學(xué)計(jì)算,通過(guò)Seaborn、 Matplotlib進(jìn)行數(shù)據(jù)圖形化展示;從實(shí)戰(zhàn)角度出發(fā),讓你在數(shù)據(jù)科學(xué)領(lǐng)域邁出重要的一步,開(kāi)啟Data Science職業(yè)之旅!
第1章 實(shí)驗(yàn)環(huán)境的搭建
本章將主要介紹Anaconda和Jupyter Notebook。包括如何在windows,Mac,linux等平臺(tái)上安裝Anaconda,以及Jupyter Notebook的基本啟動(dòng)使用方法。
1-1 導(dǎo)學(xué)視頻
1-2 Anaconda和Jupyter notebook介紹
1-3 Anaconda在Mac上的安裝演示
1-4 Anaconda在windows上安裝演示
1-5 Anaconda在Linux上的安裝演示
1-6 Jupyter-notebook的使用演示
第2章 Numpy入門(mén)
本章將介紹Python數(shù)據(jù)科學(xué)領(lǐng)域里最基礎(chǔ)的一個(gè)庫(kù)——Numpy,回顧矩陣運(yùn)算基礎(chǔ),介紹最重要的數(shù)據(jù)結(jié)構(gòu)Array以及如何通過(guò)Numpy進(jìn)行數(shù)組和矩陣運(yùn)算。
2-1 數(shù)據(jù)科學(xué)領(lǐng)域5個(gè)常用Python庫(kù)
2-2 數(shù)學(xué)基礎(chǔ)回顧之矩陣運(yùn)算
2-3 Array的創(chuàng)建及訪問(wèn)
2-4 數(shù)組與矩陣運(yùn)算
2-5 Array的input和output
第3章 Pandas入門(mén)
本章將介紹Python數(shù)據(jù)科學(xué)領(lǐng)域用于數(shù)據(jù)分析最重要的一個(gè)庫(kù)——Pandas。將從pandas里最重要的兩種數(shù)據(jù)結(jié)構(gòu)Series和DataFrame開(kāi)始,介紹其創(chuàng)建和基本操作,通過(guò)實(shí)際操作理解Series和DataFrame的關(guān)系。
3-1 Pandas Series
3-2 Pandas DataFrame
3-3 深入理解Series和Dataframe
3-4 Pandas-Dataframe-IO操作
3-5 DataFrame的Selecting和indexing
3-6 Series和Dataframe的Reindexing
3-7 談一談NaN
3-8 多級(jí)Index
3-9 Mapping和Replace
第4章 Pandas玩轉(zhuǎn)數(shù)據(jù)
本章是Pandas的進(jìn)階。我們會(huì)使用Pandas進(jìn)行高級(jí)的數(shù)據(jù)分析操作,包括如何去做數(shù)據(jù)清洗、預(yù)處理和排序等數(shù)學(xué)計(jì)算,數(shù)據(jù)的分箱技術(shù),分組技術(shù),聚合技術(shù),以及透視表等。
4-1 DataFrame的簡(jiǎn)單數(shù)學(xué)計(jì)算
4-2 Series和DataFrame的排序
4-3 重命名Dataframe的index
4-4 DataFrame的merge操作
4-5 Concatenate和Combine
4-6 通過(guò)apply進(jìn)行數(shù)據(jù)預(yù)處理
4-7 通過(guò)去重進(jìn)行數(shù)據(jù)清洗
4-8 時(shí)間序列操作基礎(chǔ)
4-9 時(shí)間序列數(shù)據(jù)的采樣和畫(huà)圖
4-10 數(shù)據(jù)分箱技術(shù)Binning
4-11 數(shù)據(jù)分組技術(shù)GroupBy
4-12 數(shù)據(jù)聚合技術(shù)Aggregation
4-13 透視表
4-14 分組和透視功能實(shí)戰(zhàn)
4-15 Streaming DataFrame
第5章 繪圖和可視化之Matplotlib
數(shù)據(jù)的可視化是數(shù)據(jù)分析領(lǐng)域里非常重要的內(nèi)容。本章會(huì)學(xué)習(xí)Matplotlib的基本使用,包括如何對(duì)Pandas里的Series和DataFrame繪圖, 以及圖形樣式和顯示模式的設(shè)置等內(nèi)容。
5-1 Matplotlib介紹
5-2 matplotlib簡(jiǎn)單繪圖之plot
5-3 matplotlib簡(jiǎn)單繪圖之subplot
5-4 Pandas繪圖之Series
5-5 Pandas繪圖之DataFrame
5-6 直方圖和密度圖
第6章 繪圖和可視化之Seaborn
Seaborn是對(duì)Matplotlib的進(jìn)一步封裝,其強(qiáng)大的調(diào)色功能和內(nèi)置的多種多樣的繪圖模式,使之成為當(dāng)下最流行的數(shù)據(jù)科學(xué)繪圖工具。本章將介紹Seaborn的基本使用,以及和matplotlib的功能對(duì)比。
6-1 seaborn介紹
6-2 seaborn實(shí)現(xiàn)直方圖和密度圖
6-3 seaborn實(shí)現(xiàn)柱狀圖和熱力圖
6-4 seaborn圖形顯示效果的設(shè)置
6-5 seaborn強(qiáng)大的調(diào)色功能
第7章 數(shù)據(jù)分析項(xiàng)目實(shí)戰(zhàn)
通過(guò)前六章的學(xué)習(xí),我們基本上掌握了數(shù)據(jù)分析領(lǐng)域里主要工具的使用,本章將通過(guò)一個(gè)股票市場(chǎng)的分析實(shí)戰(zhàn)項(xiàng)目,和大家一起用學(xué)過(guò)的知識(shí)去分析數(shù)據(jù),進(jìn)而得到有用的信息。
7-1 實(shí)戰(zhàn)準(zhǔn)備
7-2 股票市場(chǎng)分析實(shí)戰(zhàn)之?dāng)?shù)據(jù)獲取
7-3 股票市場(chǎng)分析實(shí)戰(zhàn)之歷史趨勢(shì)分析
7-4 股票市場(chǎng)分析實(shí)戰(zhàn)之風(fēng)險(xiǎn)分析
第8章 課程總結(jié)
本章的總結(jié)不是對(duì)前面8章內(nèi)容的匯總,而是給大家指明了一條繼續(xù)學(xué)習(xí)和鍛煉的道路。希望大家堅(jiān)持練習(xí),早日修成正果。
8-1 總結(jié)