首页 > 解决方案 > 如何提取更大数据集的子集

问题描述

假设我有一个更大的数据框 A 和一个更小的数据框 B,它也是数据框 A 的一个子集。两个数据集都有一个匹配的键,比如说它叫做key.

我想创建一个新的数据框,比如 C,它只保留数据集 A 中不在数据集 B 中的行。例如。如果 A 包含 1000 行,B 包含 200 行,则 C 应包含 1000-200 = 1800 行。

这样做的最佳方法是什么?使用数据框或 numpy 数组都可以。

非常感谢!

标签: pythonarraysdataframe

解决方案


推荐阅读