首页 > 解决方案 > 如何在函数中分离熊猫数据框中的文本数据

问题描述

用户在函数中输入以下内容:

 250
 1/3/2012 16:00:00   Missing_1
 1/4/2012 16:00:00   27.47
 1/5/2012 16:00:00   27.728
 1/6/2012 16:00:00   28.19
 1/9/2012 16:00:00   28.1
 1/10/2012 16:00:00  28.15
 12/13/2012 16:00:00 27.52
 12/14/2012 16:00:00 Missing_2
 12/17/2012 16:00:00 27.215
 12/18/2012 16:00:00 27.63
 12/19/2012 16:00:00 27.73
 12/20/2012 16:00:00 Missing_3
 12/21/2012 16:00:00 27.49
 12/24/2012 13:00:00 27.25
 12/26/2012 16:00:00 27.2
 12/27/2012 16:00:00 27.09
 12/28/2012 16:00:00 26.9
 12/31/2012 16:00:00 26.77

我无法读取这些数据并将其设为 pandas 数据框。

我有以下代码:

def calcMissing(readings):
  import pandas as pd
  df = pd.read_csv(readings, sep =" ") 
  print (df)

我无法让数据成为数据框,并以某种方式跳过第一行(值 250)并将该行存储在其他地方。

我期望一个数据框有两列,日期列和值列

标签: pythonpandasdataframe

解决方案


你可以试试这个:

import pandas as pd
fileName = "file.txt"
dataFrame = pd.read_csv(fileName, sep=" ", skipinitialspace=True, names=['date','time','value'])

df_new = pd.DataFrame()
df_new['timestamp'] = dataFrame['date'].str.cat(dataFrame['time'], sep=" ")
df_new['value'] = dataFrame['value']
dataFrame = df_new
print(dataFrame)

推荐阅读