python - 如何在不删除 NaN 值的情况下删除 pandas 中的重复项
问题描述
我有一个要查询的数据框,我只想从某个列中获取唯一值。
我尝试执行此代码:
database = pd.read_csv(db_file, sep='\t')
query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])
db_specification
只是一个包含我查询的两列的列表。
有些值是NaN
,我不想认为它们是重复的,我该如何实现呢?
解决方案
您可以先选择全部NaN
,然后在数据框的其余部分删除重复项。
mask = data.isna().any()
data = pd.concat([data[mask], data[~mask]])
推荐阅读
- python - 使用python修改Excel文件
- javascript - 外部 Js 文件中的一项功能未在 HTMLButtonElement.onclick 中定义
- sql - 我们如何在 HAVING 子句中编写带有搜索条件的摘要查询?
- java - 如何将流转换为增强循环
- google-apps-script - Google Apps - 如何从当前目录获取所有文件名?
- mysql - 我无法让我的查询从我的产品表中提取所有记录
- c++ - C++字节数组到int
- python - 如何将frozendict对象转换为熊猫数据框
- javascript - 如何查看 RecyclerView 项目逆序最新项目在顶部
- c# - 如何在 C# 控制台应用程序中使用扩展 ascii 字符