首页 > 解决方案 > 如何按时间和其他条件对数据帧进行排序?

问题描述

我有一个包含以下列的数据框:movie_name, date, comment.

日期格式如下(示例)2018-06-27T09:09:00Z:。

我想制作一个仅包含某部电影的第一个日期的新数据框。

例如,对于电影 a,第一个日期可能2018-09-11T:02:02:00Z是,在这种情况下,我想要电影 a 的所有行 2018-09-11。当有多部不同日期的电影时,我会怎么做?

标签: pythonpandasnumpydata-manipulationdata-cleaning

解决方案


这是一种方法:

# create a new df
new_df = old_df['date'].copy()

# get the date
new_df['date'] = pd.to_datetime(new_df['date']).dt.date

# first date of movie
new_df.groupby('movie_name')['date'].first()

推荐阅读