首页 > 解决方案 > 获取列表之间的唯一产品并保持输入顺序

问题描述

关于列表的独特(笛卡尔)乘积有很多问题,但我正在寻找一些我在其他任何问题中都没有找到的特殊问题。

我的输入将始终包含两个列表。当列表相同时,我想获得所有组合,但当它们不同时,我需要独特的产品(即顺序无关紧要)。但是,此外,我还需要保留顺序,因为输入列表的顺序很重要。事实上,我需要的是第一个列表中的项目应该始终是产品元组的第一个项目。

我有以下工作代码,除了我没有设法找到一种好的、有效的方法来保持如上所述的项目排序外,它可以满足我的要求。

import itertools

xs = ['w']
ys = ['a', 'b', 'c']

def get_up(x_in, y_in):
    if x_in == y_in:
        return itertools.combinations(x_in, 2)
    else:
        ups = []
        for x in x_in:
            for y in y_in:
              if x == y:
                  continue
              # sort so that cases such as (a,b) (b,a) get filtered by set later on
              ups.append(sorted((x, y)))
        ups = set(tuple(up) for up in ups)
        return ups

print(list(get_up(xs, ys)))
# [('c', 'w'), ('b', 'w'), ('a', 'w')]

如您所见,结果是按字母顺序排列的唯一元组列表。我使用了排序,所以我可以使用集合过滤重复的条目。但是因为第一个列表 ( xs) 包含w,所以我希望元组将其w作为第一项。

[('w', 'c'), ('w', 'b'), ('w', 'a')]

如果两个列表之间存在重叠,则两个列表中出现的项目的顺序无关紧要。所以 forxs = ['w', 'a', 'b']和forys = ['a', 'b', 'c']的顺序a无关紧要

[('w', 'c'), ('w', 'b'), ('w', 'a'), ('a', 'b'), ('a', 'c'), ('b', 'c')]
                                         ^

或者

[('w', 'c'), ('w', 'b'), ('w', 'a'), ('a', 'c'), ('b', 'a'), ('b', 'c')]
                                                     ^

最好我最终得到一个生成器(作为combinations回报)。我也只对 Python >= 3.6 感兴趣。

标签: pythonuniquegeneratorcartesian-product

解决方案


以保持顺序的方式收集元组(当列表相同时),然后通过删除其倒数也在列表中的元组进行过滤。

if x_in == y_in:
        return itertools.combinations(x_in, 2) 
    else:
        seen = set()
        for a,b in itertools.product(x_in, y_in):
            if a == b or (b, a) in seen:
                continue
            else:
                yield (a,b)
                seen.add((a,b))

这将按(x, y)顺序为您提供元组;当两者都(a,b)发生(b,a)时,您只会得到最先看到的顺序。


推荐阅读