首页 > 解决方案 > 在数据框列表中组合日期和时间(时间戳)

问题描述

我希望将日期和时间组合成数据框列表上的一个时间戳,并指定一周的通话日期。

这是错误:ValueError:无法将字符串转换为时间戳

我使用了以下功能:

def new_call_time(df):
    i=0
    df[' CALL_DATE_MANIPULATED']=str(df['CALL_DATE'][i]).split()[0] + ' ' + str(df['CALL_TIME'][i]) 
    df[' UNIX_TIME']= pd.Timestamp(df[' CALL_DATE_MANIPULATED'][i]).value//10 ** 9 
    df[' WEEK']=''

    for i in range(len(df)):
        df[' CALL_DATE_MANIPULATED'][i]=str(df['CALL_DATE'][i]).split()[0] + ' ' + str(df['CALL_TIME'][i])
        df[' UNIX_TIME'][i]= pd.Timestamp(df[' CALL_DATE_MANIPULATED'][i]).value// 10 ** 9
        df[' WEEK'][i]=df[' UNIX_TIME'][i]//604800

return df

这是函数调用语句:

for df in data_frame : 
    df = new_call_time(df)

以下是我从 excel 表中读取的表格(包含在名为 data_frame 的列表中):

    CALL_DATE    CALL_TIME
    01-JAN-2016  00:15:06   
    01-JAN-2016  07:07:00

    CALL_DATE    CALL_TIME
    01-JAN-2016  08:40:38   
    01-JAN-2016  08:44:14   

    CALL_DATE    CALL_TIME
    01-JAN-2016  08:51:10   
    01-JAN-2016  09:06:31

这适用于单个数据框,但不适用于数据框列表。

新表也应具有以下列:示例:data_frame[0] -

     CALL_DATE       CALL_TIME  CALL_DATE_MANIPULATED UNIX_TIME  WEEK
     01-JAN-2016     00:15:06   01-JAN-2016 00:15:06  1451607306 2400   
     01-JAN-2016     07:07:00   01-JAN-2016 07:07:00  1451632020 2400

非常感谢 :)))

标签: pythonpandastimestampunix-timestampvalueerror

解决方案


Series.str.split与索引一起使用str[0],然后to_datetime与参数一起errors='coerce'使用,NaT如果某些值与中定义的格式不匹配format(参数格式是为了更好的性能,但应该省略):

def new_call_time(df):
    df['CALL_DATE_MANIPULATED'] = (df['CALL_DATE'].astype(str).str.split().str[0] + ' ' + 
                                   df['CALL_TIME'].astype(str))
    dates = pd.to_datetime(df['CALL_DATE_MANIPULATED'], 
                           errors='coerce', 
                           format='%d-%b-%Y %H:%M:%S')
    df['UNIX_TIME'] = dates.values.astype(np.int64) // 10 ** 9
    df['WEEK'] = df['UNIX_TIME'] //604800
    return df

在列表推导中调用函数 new list of DataFrames

data_frame1 = [new_call_time(df) for df in data_frame]

推荐阅读