pandas_to_datetime/Mayumi
日付の処理
to_datetime関数
日付として取り込まれているデータ(yyyy/mm/dd)をハイフン区切り(yyyy-mm-dd)に書式を統一できる。
シリアル値の扱いとともに、別ページ参照。
datetimeモジュール
import datetime as dt
- dt.strftime() ... 日付、時間から文字列への変換
- dt.strptime() ... 文字列から日付、時間への変換
日付データから一部を取り出す。
kokyaku_data.head()
顧客名 かな 地域 メールアドレス 登録日
0 須賀ひとみ すが ひとみ H市 suga_hitomi@example.com 2018-01-04
1 岡田敏也 おかだ としや E市 okada_toshiya@example.com 2017-02-16
2 芳賀希 はが のぞみ A市 haga_nozomi@example.com 2018-01-07
3 荻野愛 おぎの あい F市 ogino_ai@example.com 2017-05-17
4 栗田憲一 くりた けんいち E市 kurita_kenichi@example.com 2018-01-27
kokyaku_data["yyyy_mm"] = kokyaku_data["登録日"].dt.strftime("%Y%m")
rslt = kokyaku_data.groupby("yyyy_mm").count()["顧客名"]
print(rslt)
print(len(kokyaku_data))
yyyy_mm
201701 15
201702 11
201703 14
201704 15
201705 14
201706 13
201707 17
201801 13
201802 15
201803 17
201804 5
201805 19
201806 13
201807 17
201904 2
Name: 顧客名, dtype: int64
200
- dt.weekday ... 曜日を計算(0-6:月曜:日曜)
uselog_weekday = uselog.groupby(["customer_id", "Ym", "weekday"], as_index = False).count()"customer_id", "Ym", "weekday", "log_id"
uselog_weekday.rename(columns={"log_id":"count"}, inplace=True)
uselog_weekday
customer_id Ym weekday count
0 AS002855 201804 5 4
1 AS002855 201805 2 1
2 AS002855 201805 5 4
3 AS002855 201806 5 5
4 AS002855 201807 1 1
... ... ... ... ...
93328 TS999855 201901 1 1
93329 TS999855 201901 5 4
93330 TS999855 201901 6 1
93331 TS999855 201902 5 4
93332 TS999855 201903 5 4
93333 rows × 4 columns
- 最終更新:2020-07-04 15:26:49