當前位置:編程學習大全網 - 源碼破解 - Python數據分析:可視化

Python數據分析:可視化

本文是《數據蛙三個月強化課》的第二篇總結教程,如果想要了解 數據蛙社群 ,可以閱讀 給DataFrog社群同學的學習建議 。溫馨提示:如果您已經熟悉python可視化內容,大可不必再看這篇文章,或是之挑選部分文章

對於我們數據分析師來說,不僅要自己明白數據背後的含義,而且還要給老板更直觀的展示數據的意義。所以,對於這項不可缺少的技能,讓我們來壹起學習下吧。

畫圖之前,我們先導入包和生成數據集

我們先看下所用的數據集

折線圖是我們觀察趨勢常用的圖形,可以看出數據隨著某個變量的變化趨勢,默認情況下參數 kind="line" 表示圖的類型為折線圖。

對於分類數據這種離散數據,需要查看數據是如何在各個類別之間分布的,這時候就可以使用柱狀圖。我們為每個類別畫出壹個柱子。此時,可以將參數 kind 設置為 bar 。

條形圖就是將豎直的柱狀圖翻轉90度得到的圖形。與柱狀圖壹樣,條形圖也可以有壹組或多種多組數據。

水平條形圖在類別名稱很長的時候非常方便,因為文字是從左到右書寫的,與大多數用戶的閱讀順序壹致,這使得我們的圖形容易閱讀。而柱狀圖在類別名稱很長的時候是沒有辦法很好的展示的。

直方圖是柱形圖的特殊形式,當我們想要看數據集的分布情況時,選擇直方圖。直方圖的變量劃分至不同的範圍,然後在不同的範圍中統計計數。在直方圖中,柱子之間的連續的,連續的柱子暗示數值上的連續。

箱線圖用來展示數據集的描述統計信息,也就是[四分位數],線的上下兩端表示某組數據的最大值和最小值。箱子的上下兩端表示這組數據中排在前25%位置和75%位置的數值。箱中間的橫線表示中位數。此時可以將參數 kind 設置為 box。

如果想要畫出散點圖,可以將參數 kind 設置為 scatter,同時需要指定 x 和 y。通過散點圖可以探索變量之間的關系。

餅圖是用面積表示壹組數據的占比,此時可以將參數 kind 設置為 pie。

我們剛開始學習的同學,最基本應該明白什麽數據應該用什麽圖形來展示,同學們來壹起總結吧。

  • 上一篇:遊戲使人快樂,卻不能沈迷,為什麽?
  • 下一篇:可愛字體
  • copyright 2024編程學習大全網