python - 如何使用熊猫应用多个过滤器?
问题描述
如何使用 pandas 轻松应用多个过滤器以获得 100 个值?有两列(column/column2)和 500000 行。我的目标是:在 sample.xlsx 文件中找到一些值,例如 value-1、value-2 等(应该包括所有这些值)。然后从 column2 提取唯一值到另一个 xlsx 文件。
import pandas as pd
df=pd.read_excel('sample.xlsx')
filtered_list = df[(df['column']=='value-1')|
(df['column']=='value-2')]
(df['column']=='value-3')]
.......
(df['column']=='value-100')]
print(filtered_list)
list = ['value-1', 'value-2', ..., 'value-100']
**Sample Dataset**
column column2
value-1 gene1
value-2 gene1
value-3 gene2
value-4 gene2
value-5 gene2
..... ....
value-100 gene3
value-102 gene3
value-105 gene4
**1. Desired Output**
column column2
value-1 gene1
value-2 gene1
value-3 gene2
value-4 gene2
value-5 gene2
..... ....
value-100 gene3
**2. Desired Output**
column2
gene1
gene2
gene3
@domiziano
解决方案
如果你有你想要的所有值的列表,你可以做
list = ['value-1', 'value-2', ..., 'value-100']
filtered_list = df[df['column'].isin(list)]
然后查看 column2 中的所有唯一值
filtered_list['column2'].unique()
推荐阅读
- swift - 如何将UItableView中姓氏的第一个字母分组为部分
- react-native - 如何处理 react native ble plx [BleError: Operation was denied]?
- hl7-fhir - 检索主 CarePlan + 作为主计划一部分的所有子 CarePlan
- python - 循环遍历 Excel 工作表以使用 Python Pandas 提取单个单元格值
- iis - 为所有大于 ca 1MB 的文件重置 IIS 连接?
- python-3.x - 在 smtplib 上使用变量
- swift - USDZ 文件无法在 QuickLook 应用中打开
- c++ - 如何创建 IDWriteTextLayout4?
- xslt-1.0 - 对嵌套 XML 中的特定节点进行排序
- javascript - 带有 TCP 和 UDP 的库 JS 以及用于 Firefox 和 Chrome 的 WebExtension