首页 > 解决方案 > python字典 - 合并两个字典并在它们匹配时附加键值

问题描述

我有两个字典列表。一种是嵌套分层格式,另一种是简单的字典列表。我正在尝试像我们在 pandas 或 sql 中那样做的“外部连接”,比如“加入”。基本上,我试图从字典中捕获键/值,而另一个键/值不存在。这是我尝试过的。

字典 1:大型嵌套字典:

data = [
    {'file_name': 'abc.pdf',
     'year':'2016',
      'overview': {
          'student_id': '123abc',
           'name': 'Adam Smith',
           'courses': ['Math', 'Physics'],
           }},

    {'file_name': 'def.pdf',
     'year':'2017',
      'overview': {
          'student_id': '123abc',
           'name': 'Adam Smith',
           'courses': ['Arts'],
           }}
]

字典2:

mapper =[{
    'year':'2016',
    'student_id': '123abc',
    'counselor':'Matthews',
    'grades':'85'
}]

尝试/合并

pairs = zip(mapper,data)

试试 1

[(x,y) for x, y in pairs if x['student_id'] == y['overview']['student_id']]

>> gives result:
[({'year': '2016',
   'student_id': '123abc',
   'counselor': 'Matthews',
   'grades': '85'},
  {'file_name': 'abc.pdf',
   'year': '2016',
   'overview': {'student_id': '123abc',
    'name': 'Adam Smith',
    'courses': ['Math', 'Physics']}})]

尝试2:

[(x,y) for x, y in pairs if x['student_id'] == y['overview']['student_id'] & x['year'] == y['year']]
# gives errors: `TypeError: unsupported operand type(s) for &: 'str' and 'str'`

试图得到这个结果:如果两个字典中的 year 和 student_id 匹配,那么给出这个结果。从字典 2:我试图匹配如果 year 和 student_id 匹配然后填充辅导员,'grades' 到字典 1。如果不匹配,则给定字典元素。

new_data = [
    {'file_name': 'abc.pdf',
     'year':'2016',
      'overview': {
          'student_id': '123abc',
           'name': 'Adam Smith',
           'courses': ['Math', 'Physics'],
            'counselor':'Matthews',
            'grades':'85'
           }},

    {'file_name': 'def.pdf',
     'year':'2017',
      'overview': {
          'student_id': '123abc',
           'name': 'Adam Smith',
           'courses': ['Arts'],
           }}
]

标签: python-3.xdictionary-comprehension

解决方案


在这种情况下,我认为zip这不是一个好的选择。我会将数据的 ['overview'] 字典与映射器字典合并:

for idx, i in enumerate(data):
    for j in mapper:
        if i['overview']['student_id'] in j['student_id'] and i['year'] == j['year']:
            data[idx]['overview'] = {**i['overview'], **j}

推荐阅读