python - 如何使用 json 文件中的“时间戳”将 DataFrame 设置为从 X 日到 Y 日,而不是从 X 年到 Y 年?
问题描述
我想对不同的 json 文件做一些文本分析。这些文件被命名为例如“2017.json”或“2018.json”。
它们包含许多文本,每个文本都有一个时间戳。(例如“时间戳”:“2019-01-31T19:15:00”,)
pandas的基本结构就是所谓的DataFrame。我首先创建了一个 DataFrame,然后将各个年份(这里只有一年)的数据附加到它上面。这确保了数据在相同的结构中都是可用的。
现在我只能用个别年份创建 DataFrame。是否可以使用文件中的时间戳来创建 DataFrame,例如从第 x 天到第 y 天?
import pandas as pd
data = pd.DataFrame()
#json file 2017
for year in range (2017,2018):
data = pd.concat([data, pd.read_json("%d.json" % year, orient="records")], ignore_index=True)
解决方案
如果您知道特定范围,则可以过滤这些特定日期的数据框,并从中获取新的数据框。
filtered_df = df[(df['date'] > 'from date') & (df['date'] < 'to date')]
然后您可以保存在文件名中提及 from & to 范围的过滤后的_df
推荐阅读
- android - Android SDK 中 FetchedAppGateKeepersManager 中的 Facebook 错误崩溃
- javascript - 照片上传的描述框输入
- finance - decimal 和 unitRef 属性如何帮助数值在 XBRL 中表示
- javascript - 如何比较 numberOfLines 道具值
来自数据的行数? - mysql - MySQL - Now() 仅将日期值插入 DateTime 列
- google-cloud-firestore - 获取 ID 与 UID 相同的 Firestore 文档失败
- regex - Grafana 正则表达式问题
- bash - 创建 TAR 存档后如何加密
- python - 在csv中查找给定长度大于某个阈值的所有唯一属性集
- java - 两个循环内的返回语句