python - 提取嵌套字典和列表中的叶值集,不包括无
问题描述
我有一个从 YAML 读取的嵌套结构,它由嵌套列表和/或嵌套字典组成,或者在不同级别的嵌套中两者混合。可以假设该结构不包含任何递归对象。
如何仅从中提取叶值?另外,我不想要任何None
价值。叶值包含我所关心的字符串。考虑到结构的最大深度不足以超过堆栈递归限制,可以使用递归。发电机也可以选择。
存在处理扁平化列表或字典的类似问题,但不是两者的混合。或者,如果展平一个 dict,它们还会返回我并不真正需要的展平键,并且有名称冲突的风险。
我尝试过more_itertools.collapse
,但它的示例仅显示它适用于嵌套列表,而不适用于混合字典和列表。
样本输入
struct1 = {
"k0": None,
"k1": "v1",
"k2": ["v0", None, "v1"],
"k3": ["v0", ["v1", "v2", None, ["v3"], ["v4", "v5"], []]],
"k4": {"k0": None},
"k5": {"k1": {"k2": {"k3": "v3", "k4": "v6"}, "k4": {}}},
"k6": [{}, {"k1": "v7"}, {"k2": "v8", "k3": "v9", "k4": {"k5": {"k6": "v10"}, "k7": {}}}],
"k7": {
"k0": [],
"k1": ["v11"],
"k2": ["v12", "v13"],
"k3": ["v14", ["v15"]],
"k4": [["v16"], ["v17"]],
"k5": ["v18", ["v19", "v20", ["v21", "v22", []]]],
},
}
struct2 = ["aa", "bb", "cc", ["dd", "ee", ["ff", "gg"], None, []]]
预期产出
struct1_leaves = {f"v{i}" for i in range(23)}
struct2_leaves = {f"{s}{s}" for s in "abcdefg"}
解决方案
另一种可能性是使用带有递归的生成器:
struct1 = {'k0': None, 'k1': 'v1', 'k2': ['v0', None, 'v1'], 'k3': ['v0', ['v1', 'v2', None, ['v3'], ['v4', 'v5'], []]], 'k4': {'k0': None}, 'k5': {'k1': {'k2': {'k3': 'v3', 'k4': 'v6'}, 'k4': {}}}, 'k6': [{}, {'k1': 'v7'}, {'k2': 'v8', 'k3': 'v9', 'k4': {'k5': {'k6': 'v10'}, 'k7': {}}}], 'k7': {'k0': [], 'k1': ['v11'], 'k2': ['v12', 'v13'], 'k3': ['v14', ['v15']], 'k4': [['v16'], ['v17']], 'k5': ['v18', ['v19', 'v20', ['v21', 'v22', []]]]}}
def flatten(d):
for i in getattr(d, 'values', lambda :d)():
if isinstance(i, str):
yield i
elif i is not None:
yield from flatten(i)
print(set(flatten(struct1)))
输出:
{'v10', 'v9', 'v8', 'v7', 'v0', 'v18', 'v16', 'v1', 'v21', 'v11', 'v14', 'v15', 'v12', 'v13', 'v4', 'v2', 'v5', 'v20', 'v6', 'v19', 'v3', 'v22', 'v17'}
struct2 = ["aa", "bb", "cc", ["dd", "ee", ["ff", "gg"], None, []]]
print(set(flatten(struct2)))
输出:
{'cc', 'ff', 'dd', 'gg', 'bb', 'ee', 'aa'}
推荐阅读
- batch-file - 仅在第一个批处理文件执行成功的情况下执行 cmd.exe 中的第二个批处理文件
- java - Android中属性的GetValue
- sql - rownumber() 函数计算相邻单元格
- javascript - React Hooks:TypeError:无法读取 null 的属性“firstName”
- amazon-web-services - CodeBuild 等待 Cloudformation
- php - 如何使用公司徽标从数据库中获取特定数据
- python - 如何将标题行转换为熊猫中的普通行
- c++ - 是否有用于执行反向字符串拆分器的开箱即用功能?
- c# - 仅在我的应用程序中的方法完成后,如何在单元测试中运行方法?
- java - writeObject(this) 停止程序