python - 通过索引将列从 1 个数据帧添加到另一个链接的正确语法
问题描述
首先,由于数据集很大,我试图将其作为矢量操作来执行。
import pandas as pd
sub_list = [{"uniqueId": "123456", "ref_idx": 1},
{"uniqueId": "123457", "ref_idx": 2},
{"uniqueId": "123458", "ref_idx": 3},
{"uniqueId": "123459", "ref_idx": 4},
{"uniqueId": "123460", "ref_idx": 5},
{"uniqueId": "123461", "ref_idx": 6}]
primary_list = [{"uniqueId": "123456"},
{"uniqueId": "123457"},
{"uniqueId": "123458"},
{"uniqueId": "123459"},
{"uniqueId": "123460"},
{"uniqueId": "123461"},
{"uniqueId": "123462"},
{"uniqueId": "123463"},
{"uniqueId": "123464"},
{"uniqueId": "123465"}]
subset_df = pd.DataFrame(sub_list)
primary_df = pd.DataFrame(primary_list)
subset_df.set_index("uniqueId", inplace=True)
primary_df.set_index("uniqueId", inplace=True)
primary_df["ref_idx"] = primary_df.loc([subset_df.index]["ref_idx"])
问题在于最后一条语句。我已经尝试了如何从subset_df(ref_idx 值)获取切片并将其作为新列填充到primary_df 的各种迭代。当然,那些没有出现在subset_df中的记录在primary_df中不会有值(NaN)。没关系。
只是不确定语法是否正确。
我看到像 TypeError: list indices must be integers or slices, not str; 这样的错误。call () 接受 1 到 2 个位置参数,但给出了 3 个,当一个分隔 ([subset_df.index], ["ref_idx"])
基本上,使用索引来限定数据但返回 ref_idx 值。
想法?
解决方案
推荐阅读
- javascript - “无法在 am4themes 读取未定义的属性...”同时通过 AmCharts4 中的主题格式化 chart.plotContainer
- session - 使用 UserCake 注销太快
- opencl - 如何使用 boost::compute::atan2?
- javascript - jsGrid - 单击提交按钮时获取新数据
- firebase - firebase.firestore.GeoPoint(long, lat) 不是构造函数
- c++ - 替换 C++17 中已删除的 bind1st
- python - 使用完全相同的 API 调用时,Google App Engine 实例的行为会有所不同
- python - 我拿了一个 Java 类并试图将其转换为 python 我做错了什么?
- php - Mediawiki 移动现有图像目录
- kubernetes - 从 S3 上的 kops 配置创建 kubernetes go-client 配置