python - 如何在函数中分离熊猫数据框中的文本数据
问题描述
用户在函数中输入以下内容:
250
1/3/2012 16:00:00 Missing_1
1/4/2012 16:00:00 27.47
1/5/2012 16:00:00 27.728
1/6/2012 16:00:00 28.19
1/9/2012 16:00:00 28.1
1/10/2012 16:00:00 28.15
12/13/2012 16:00:00 27.52
12/14/2012 16:00:00 Missing_2
12/17/2012 16:00:00 27.215
12/18/2012 16:00:00 27.63
12/19/2012 16:00:00 27.73
12/20/2012 16:00:00 Missing_3
12/21/2012 16:00:00 27.49
12/24/2012 13:00:00 27.25
12/26/2012 16:00:00 27.2
12/27/2012 16:00:00 27.09
12/28/2012 16:00:00 26.9
12/31/2012 16:00:00 26.77
我无法读取这些数据并将其设为 pandas 数据框。
我有以下代码:
def calcMissing(readings):
import pandas as pd
df = pd.read_csv(readings, sep =" ")
print (df)
我无法让数据成为数据框,并以某种方式跳过第一行(值 250)并将该行存储在其他地方。
我期望一个数据框有两列,日期列和值列
解决方案
你可以试试这个:
import pandas as pd
fileName = "file.txt"
dataFrame = pd.read_csv(fileName, sep=" ", skipinitialspace=True, names=['date','time','value'])
df_new = pd.DataFrame()
df_new['timestamp'] = dataFrame['date'].str.cat(dataFrame['time'], sep=" ")
df_new['value'] = dataFrame['value']
dataFrame = df_new
print(dataFrame)
推荐阅读
- python-3.x - 定义函数以对 df 中的记录进行分类并添加新列。熊猫 dfs
- python - python web抓取请求错误(mod安全)
- android - 几秒钟后如何在 Android 10 中重启 Android 应用
- android - 项目结构如何
- ios - 为什么编译器在一个项目上显示错误,而在同一个库 CDMarkdownKit 的另一个项目上却没有?
- c# - 使用程序的方法?
- docker - 尝试在 AWS 上安装 RocketChat,犯了一些错误
- python - 对数组中的每行应用 argsort,根据阈值跳过某些元素 - NumPy / Python
- python - ret = torch._C._nn.nll_loss(input, target, weight, _Reduction.get_enum(reduction), ignore_index) throws IndexError: Target 42 is out of bounds
- mysql - 如何在 TypeORM 中创建具有 TIME 类型的实体列