python - 过滤小时差 - pandas
问题描述
我正在尝试编写一个代码来过滤掉小的时间差。图 1 显示了原始数据。图 2 和 3 显示了阈值分别定义为 2 和 4 的预期输出。
我已经尝试使用 for 循环 - 它有效,但我不喜欢数据框中的“替换”。我想检查是否有更好的方法来做到这一点,可以潜在地避免替代并且可以扩展到更大的数据集。谢谢
这是我的代码:
time_threshold = 2
for i in range(data.shape[0]):
if (data.iloc[i].time_diff <= time_threshold):
data['start'].iloc[i] = data.iloc[i-1].start
data = data.drop_duplicates(subset = 'start', keep = 'last')
解决方案
推荐阅读
- tensorflow - Tensorflow的数据流图和DNN有什么关系?
- machine-learning - 当您的模型在 Google Cloud 上进行训练时,您可以关闭计算机吗?
- json - 是否将 {"some":"thing\n"} - json 对象表示为被视为有效 json 的 unicode?
- android - Firebase AB 测试 iOS 用户定位,应用版本不工作
- android - Firebase 不接受 SHA1 用于发布密钥库
- php - 从 php 更改文件夹所有权
- php - 如何在 php 的下拉列表中使用选定的值?
- ios - “此应用需要 iOS 11.3”,我使用的是 11.3.3
- asp.net - 如何将自定义主题添加到 Umbraco Articulate?
- c# - 上下文菜单打开时,单击上下文菜单外的控件不会被击中