當前位置:編程學習大全網 - 源碼下載 - 第四章 分組

第四章 分組

請根據上下四分位數分割,將體重分為high、normal、low三組,統計身高的均值。

上壹小節介紹了可以通過 drop_duplicates 得到具體的組類別,現請用 groups 屬性完成類似的功能。

因為它的速度基本都會經過內部的優化,使用功能時應當優先考慮。

max/min/mean/median/count/all/any/idxmax/idxmin/mad/nunique/skew/quantile/sum/std/var/sem/size/prod

使用:df.groupby('Wight2')['Height'].mean()

請查閱文檔,明確 all/any/mad/skew/sem/prod 函數的含義。

可以解決內置聚合函數的4個問題:

請使用傳入字典的方法完成gb. agg (['sum', 'idxmax', 'skew'])等價的聚合任務。

在 groupby 對象中可以使用 describe 方法進行統計信息匯總,請同時使用多個聚合函數,完成與該方法相同的功能。

累計函數cumcount/cumsum/cumprod/cummax/cummin

在 groupby 對象中, rank 方法也是壹個實用的變換函數,請查閱它的功能並給出壹個使用的例子。

功能:計算沿軸的數值數據等級(1到n)。相等的值被分配壹個等級,這個等級是這些值等級的平均值(默認)

參數:

被調用的自定義函數, 其傳入值為數據源的序列 ,與 agg 的傳入類型是壹致的,其最後的返回結果是行列索引與數據源壹致的 DataFrame 。

對於 transform 方法無法像 agg 壹樣,通過傳入字典來對指定列使用特定的變換,如果需要在壹次 transform 的調用中實現這種功能,請給出解決方案。

傳入:和filter相同

輸出:3種情況:

會。。不知道是不是這樣:

報的錯是索引名稱需要是可以hash的類型(Series.name must be a hashable type)

不報錯

列索引不同:

<img src="typora-user-images/image-20201225223748508.png" alt="image-20201225223748508" style="zoom:50%;" />

行索引不同:

<img src="typora-user-images/image-20201225223939672.png" alt="image-20201225223939672" style="zoom:50%;" />

每次運行的時間不太相同,數據量小,時間差距不太大。

現有壹份汽車數據集,其中 Brand, Disp., HP 分別代表汽車品牌、發動機蓄量、發動機輸出。

  • 上一篇:linux中止運行linux中止
  • 下一篇:非IE內核瀏覽器有哪些?
  • copyright 2024編程學習大全網