python - 有没有办法在 pandas 中创建代表三个数据帧的共享值的虚拟变量?
问题描述
我有三个数据框,我创建了三组不同的虚拟列。每个数据框都有一组与其他两个略有不同的虚拟变量。
我正在尝试结合看起来像这样的东西 -
set1 - (a, b, c, d, e, f)
set2 - (a, b, c, d, f, k)
set3 - (a, c, d, e, f, i, n)
期望的集合 - (a, c, d, f)
有没有办法通过比较列名作为集合来做到这一点?
解决方案
我认为这就是你的意思,合并数据框。答案是肯定的。Pandas 提供了将数据框合并为一个的强大功能。如果您选择它,您可能会假设两个数据框共享一些共同的值:
import pandas as pd
df1 = pd.DataFrame({
'letter':['a','b','h','d']})
df2 = pd.DataFrame({
'letter':['f','q','b','a']})
print(df1.merge(df2))
PRINTS:
letter
0 a
1 b
如果您想进一步扩展功能,我建议您查看文档:https ://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html
推荐阅读
- php - 通过使用 htaccess 打开文件夹目录打开 check.php
- python - Python - ode上的奇怪情节点
- sql - 如何使用 Doctrine QueryBuilder 删除多个实体
- c - 为什么使用 long as 数据类型会使“隐式转换失去整数精度”消失?
- python - python打开浏览器并获取html
- node.js - Couchdb 视图按行返回行
- javascript - App Inventor WebViewer 缩小尺寸
- php - Laravel Eloquent Relation Query - 获取数据以及关系属性
- node.js - Nodemailer /send 给出 404 错误
- c++ - 在运行时生成可变参数列表