當前位置:編程學習大全網 - 源碼下載 - python基礎:數據分析常用包

python基礎:數據分析常用包

本文重點介紹pyhon最常用的幾個庫:

SymPy是python壹個科學計算庫,有壹套強大的科學計算體系,覆蓋了從基本的符號運算到計算數學、代數學、離散數學、量子物理等多個領域。可以完成諸如多項式求值、求極限、解方程、微分方程、級數展開、矩陣運算等等計算問題。

雖然Matlab的類似科學計算能力也很強大,但是Python以其語法簡單、易上手、異常豐富的三方庫生態,個人認為可以更優雅地解決日常遇到的各種計算問題。

Numpy是用於數據分析、機器學習、科學計算的重要軟件包。它極大的簡化了向量矩的操作及處理。Python的不少數據處理軟件包依賴於Numpy作為其基礎架構的核心部分(如Scikit-learn, Scipy, Pandas和tensflow等)

Scipy是壹個科學計算工具包,可以處理插值、積分、優化、圖像處理、常微分方程數據解的求解、信息處理等問題。它是基於Numpy搭建的。可用於有效計算Numpy矩陣,使Numpy和Scipy協同工作,高效解決問題

Sklearn是壹個機器學習包,它是基於Numpy, Scipy和matplotlib搭建。它的主要功能分為六大部分:分類、回歸、聚類、數據降維、模型選擇和數據預處理,性能也很不錯。

不過,sklearn不支持深度學習和強化學習,不支持圖模型和序列預測,同時也不支持python之外的語言,不支持PyPy也不支持GPU加速。

常用子模塊有:

Statsmodels用於擬合統計模型、參數據估計、假設檢驗、不確定性評估以及數據探索和可視化。相比sklearn,statsmodels更側重於統計推理、p值和不確定性評價。常用子模塊包括:

Matplotlib是python中類似於matlab的繪圖工具,實際上matplotlib有壹套完全依照MATLAB的函數形式的繪圖接口,在matplot.pyplot模塊中,這套函數接口方便MATLAB用戶過度到matplotlib

Seaborn在matplotlib基礎上進行封裝的,但seaborn是針對統計繪圖的。壹般來說,seaborn能滿足數據分析90%的的繪圖需求。

Seaborn旨在使可視化成為探索和理解數據的核心部分。其面向數據集的繪圖功能對包含整個數據集的數據框和數據組進行操作,並在內部執行必要的語義映射和統計聚合,以生成信息圖。

Seaborn可以做熱力圖、散點圖、直方圖、箱形圖、樹形圖、熱點圖等等

Pandas是基於Numpy數組構建的,專門為處理表格和混雜數據設的,而Numpy更適合處理統壹的數據數組數據。

參考資料:

  • 上一篇:想搭建壹個小程序商城,要多少錢啊?有人壹起眾籌壹個嗎?
  • 下一篇:面試官:Redis中的緩沖區了解嗎-
  • copyright 2024編程學習大全網