pandas_pivot/Mayumi

ピボットテーブル

ピボットテーブルメソッドを呼び出し、
  • 集計対象 ; values
  • 集計キー ; index(行)/ columns(列)
  • 集計方法 ; aggfunc
を指定する。

aggfuncのデフォルトは mean(平均値)。
  • aggfunc = "sum" ... 合計
  • aggfunc = "size" ... カウント(?)
ほか、max, min, count, median なども使える。

pd.pivot_table(join_data, index="item_name", columns="payment_month", values=["price", "quantity"], aggfunc="sum")
   price     quantity
payment_month 201902 201903 201904 201905 201906 201907 201902 201903 201904 201905 201906 201907
item_name
PC-A 24150000 26000000 25900000 24850000 26000000 25250000 483 520 518 497 520 505
PC-B 25245000 25500000 23460000 25330000 23970000 28220000 297 300 276 298 282 332
PC-C 19800000 19080000 21960000 20520000 21840000 19440000 165 159 183 171 182 162
PC-D 31140000 25740000 24300000 25920000 28800000 26100000 173 143 135 144 160 145
PC-E 59850000 64050000 64890000 58800000 63420000 71610000 285 305 309 280 302 341


  • 欠損値の変換 ; fill_value
pd.pivot_tableの引数の中に fill_value = 0 と入れると、NaN が 0 に置換される。



  • 最終更新:2020-03-29 04:21:26

このWIKIを編集するにはパスワード入力が必要です

認証パスワード