python - 从同一列中的数据行中减去数据行
问题描述
我刚开始在我的数据科学课上使用 python,所以除了基础知识之外,我基本上对它一无所知。
我有大约 600 行数据,其中一半是来自一个国家的数据,另一半是来自另一个国家的数据。它们首先显示为国家 1 的所有数据,然后是国家 2 的所有数据。是否可以添加一列,从国家 2 的同一组数据中减去国家 1 的一组数据。我希望我是有道理的。
这是整个数据表的片段。两个装箱值都来自同一列。我基本上想从上面的盒装值中减去下面的盒装值。
解决方案
首先,我们可能需要知道每个国家的行数是否相同。如果您事先已经知道这一点,那么没有问题,您可以通过以下操作进行检查:
df.groupby('country_name_column').count()
如果它们不相同,您可能需要对数据进行一些额外的处理。如果它们是,那么您可以通过使用布尔索引过滤对每个国家/地区的系列进行操作来轻松地减去值。
diff = df[df['country_name_column'] == 'Kuwait']['boxed_value_column'] - df[df['country_name_column'] == 'Panama']['boxed_value_column']
diff.head()
推荐阅读
- google-api - Kubernetes 中的符号链接秘密
- powershell - 使用 powershell 将所有打印机复制到新机器
- intellij-idea - 如何在 IntelliJ 中将文件添加到版本控制?
- python - 在对 groupby 执行求和后保留输出中的列
- xml - 第 4 行第 5 列的错误:文档末尾的额外内容
- arduino - Arduino UNO GSM
- java - 如何在不知道 Java 枚举类型的情况下使用反射比较多个枚举?
- java - 如何使用 Log4j 注册额外的 PropertySource?
- windows - Windows - 批量符号链接文件和文件夹递归
- php - Codeigniter 没有更新我的数据