python - 如何在熊猫中将日期列拆分为单独的日、月、年列
问题描述
我有一个数据集df
:
Dewptm Fog Humidity Pressurem Tempm Wspdm Rainfall
datetime_utc
1996-11-01 11.666667 0.0 52.916667 -2659.666667 22.333333 2.466667 0
1996-11-02 10.458333 0.0 48.625000 1009.833333 22.916667 8.028571 0
1996-11-03 12.041667 0.0 55.958333 1010.500000 21.791667 4.804545 0
1996-11-04 10.222222 0.0 48.055556 1011.333333 22.722222 1.964706 0
...
这里是df.columns
:
Index(['Dewptm', 'Fog', 'Humidity', 'Pressurem', 'Rain', 'Tempm', 'Wspdm',
'Rainfall'],
dtype='object')
如何将datetime_utc
列拆分为年、月和日列?
我试过了:
df["day"] = df['datetime_utc'].map(lambda x: x.day)
df["month"] = df['datetime_utc'].map(lambda x: x.month)
df["year"] = df['datetime_utc'].map(lambda x: x.year)
错误:
KeyError:'datetime_utc'
还
pd.concat([df.drop('datetime_utc', axis = 1),
(df.datetime_utc.str.split("-).str[:3].apply(pd.Series)
.rename(columns={0:'year', 1:'month', 2:'day'}))], axis = 1)
我收到错误:
KeyError:“['datetime_utc'] not found in axis” 我面临的问题是该列
datetime_utc
是我数据集中的默认索引列,请建议我一种方法。
解决方案
问题是datetime_utc
在您的索引中而不是列中,因此您必须访问索引才能创建新列:
df['day'] = df.index.day
df['month'] = df.index.month
df['year'] = df.index.year
print(df)
Dewptm Fog Humidity Pressurem Tempm Wspdm \
datetime_utc
1996-11-01 11.666667 0.0 52.916667 -2659.666667 22.333333 2.466667
1996-11-02 10.458333 0.0 48.625000 1009.833333 22.916667 8.028571
1996-11-03 12.041667 0.0 55.958333 1010.500000 21.791667 4.804545
1996-11-04 10.222222 0.0 48.055556 1011.333333 22.722222 1.964706
Rainfall day month year
datetime_utc
1996-11-01 0 1 11 1996
1996-11-02 0 2 11 1996
1996-11-03 0 3 11 1996
1996-11-04 0 4 11 1996
如果你想datetime_utc
作为一个列,你必须重置你的索引,然后你可以访问 datetime 方法,dt.month
如下所示:dt.year
dt.day
# Reset our index so datetime_utc becomes a column
df.reset_index(inplace=True)
# Create new columns
df['day'] = df['datetime_utc'].dt.day
df['month'] = df['datetime_utc'].dt.month
df['year'] = df['datetime_utc'].dt.year
print(df)
datetime_utc Dewptm Fog Humidity Pressurem Tempm Wspdm \
0 1996-11-01 11.666667 0.0 52.916667 -2659.666667 22.333333 2.466667
1 1996-11-02 10.458333 0.0 48.625000 1009.833333 22.916667 8.028571
2 1996-11-03 12.041667 0.0 55.958333 1010.500000 21.791667 4.804545
3 1996-11-04 10.222222 0.0 48.055556 1011.333333 22.722222 1.964706
Rainfall day month year
0 0 1 11 1996
1 0 2 11 1996
2 0 3 11 1996
3 0 4 11 1996
请注意,如果您的索引datetime
尚未输入,请在尝试提取年、月和日之前使用以下内容:
df.index = pd.to_datetime(df.index)
推荐阅读
- javascript - 如何使用 jquery 获取列表元素?
- database - 手动同步数据库操作并避免内置数据库同步机制是否明智?
- html - Adobe XD HTML 文件导出视图大小对于浏览器来说太大了。我怎样才能让它变小?
- ios - swiftui 数组内容在函数闭包内更新,但不保留在其他视图中
- php - 如何计算数据库中的行数
- kubernetes - 在 Kops v 1.16 中,尽管集群运行良好,但在 aws 点实例组的“kops rolling-update cluster”中获取状态 NeedsUpdate 和 Ready 0
- django - 单元测试:如何模拟 MEDIA_ROOT 但仍访问存储在我的普通 MEDIA 文件夹中的文件
- opencl - OpenCL 2.0 设备命令队列不断填满并停止执行
- reactjs - 按下反应钩子时显示工具提示并在几秒钟后隐藏
- c++ - 字符串向量并使用 C++20 范围进行转换