python - 具有高错误密度的时间段(在数据帧中)
问题描述
我有一个数据框,它有一个时间戳列和一个错误列,错误列有 6 种类型的值(NaN、D、E、F、G、H),我需要及时提取高密度错误 E 的时间段我不知道如何解决这个问题。
我的方法是创建一个直方图,然后我可以计算每个错误的概率密度,然后我会迭代所有天并选择 E 概率最高的那些。
有没有解决这类问题的方法?谢谢你的时间
解决方案
这是一种方法:
df.groupby(df.timestamp.dt.date).error.apply(lambda s: s.eq(2).sum() / s.size)
我们按时间戳的日期进行分组,并对error
s 应用一个函数,该函数采用组中 2 的比率。在此之后,您可以链接idxmax
以获得具有最高错误密度的日期,或者nlargest(n)
获得最高的 n 个日期。
使用提供的示例数据,这给出:
timestamp
2019-11-10 0.4
Name: error, dtype: float64
(因为只有1天,所以只出现。)
推荐阅读
- hyperledger-fabric - 无法持久化 etcd/raft 数据:输入/输出错误
- json - 将 JSON 数据的 CSV 从 S3 上传到 Redshift
- python - 如何确定透视变换后点在新图像平面中的位置?
- java - SQS 消息正在移动到 DLQ 甚至一次都没有处理
- excel - 在 VBA 中的列中搜索日期
- angular - 如何显示 AWS Amplify Storage 对象返回的键列表?
- html - 如何使下拉菜单居中
- java - 在内存中,activemq 不会跨连接持续存在
- android - 如何在 android 中执行无符号字节数组的 MD5 哈希?
- python - 有没有一种方法可以将 sympy 函数与参数进行绘图和数值积分?