python - 两个数组(一个表示索引,另一个表示重复次数)。我想根据重复次数删除索引(python)
问题描述
我在一个带有一些数据框的 colab 中工作,我有两个 numpy 数组:
- 第一个表示行的索引。-另一个表示重复次数(在这之前我做了一些方法)。
如果我打印两个数组,我会得到如下信息:
print(uniqueValues, occurCount)
OUTPUT: [ 13 33 66 ... 99907 99911 99928] [7 1 6 ... 1 6 4]
我们可以理解为:13重复7次,33重复1次....
现在的问题是:如何根据重复次数从两个数组中删除索引和重复?
示例: if < 5 then remove element 预期输出:[ 13 66 ... 99911] [7 6 ... 6]
解决方案
您可以将匹配值occurCount
用作过滤器uniqueValues
并occurCount
使用布尔索引:
uniqueValues = uniqueValues[occurCount >= 5]
occurCount = occurCount[occurCount >= 5]
例如:
import numpy as np
uniqueValues = np.array([13, 33, 66, 99907, 99911, 99928])
occurCount = np.array([7, 1, 6, 1, 6, 4])
uniqueValues = uniqueValues[occurCount >= 5]
occurCount = occurCount[occurCount >= 5]
print(uniqueValues )
print(occurCount)
输出:
[ 13 66 99911]
[7 6 6]
推荐阅读
- shell - 使用 sed 从 File 中的模式中提取内容
- python - 如何在 django 表单中添加自定义方法
- active-directory - 无法从任何其他非 Windows 计算机连接到 AD ldap
- javascript - 如果购物车中已经存在商品 - reactjs,如何更新购物车数量?
- python - 使 python COM 客户端可测试
- sql - 获取最小日期记录并计算特定时间范围内的后续记录
- email - 如何将 [checkbox] 邮件标签值放入 CF7 中电子邮件内的无序列表中?
- swift - URLsession .failure 使应用程序崩溃,因为错误为零
- java - X509Certificate 中不允许 Java 空颁发者 DN(Libimobiledevice 实现)
- sql - 如何避免在我的红移查询中使用限制子句?