首页 > 解决方案 > 将列表的元素与它们自身进行比较

问题描述

我有物品清单:

['MRS_103_005_010_BG_001_v001',
'MRS_103_005_010_BG_001_v002',
'MRS_103_005_010_FG_001_v001',
'MRS_103_005_010_FG_001_v002',
'MRS_103_005_010_FG_001_v003',
'MRS_103_005_020_BG_001_v001',
'MRS_103_005_020_BG_001_v002',
'MRS_103_005_020_BG_001_v003']

我需要识别每个项目的最新版本并将其存储到新列表中。我的逻辑有问题。

基于它是如何构建的,我相信我需要首先将索引相互比较。如果我找到匹配项,我会检查哪个数字更大。

我想我首先需要检查文件夹名称是否在当前索引和下一个索引之间匹配。我通过创建两个变量 0 和 1 来表示索引,这样我就可以对列表本身进行交错增量比较。如果两个索引匹配,我需要检查最后的 vXXX 号码。无论哪个是最高的,都将被附加到新列表中。

我怀疑问题在于列表的一个副本在另一个副本之前到达空索引,但我不确定如何弥补这一点。

再说一次,我不是专业的程序员。任何帮助,将不胜感激!谢谢你。

# Preparing variables for filtering the folders
versions = foundVerList
verAmountTotal = len(foundVerList) 
verIndex = 0
verNextIndex = 1
highestVerCount = 1
filteredVersions = []


# Filtering, this will find the latest version of each folder and store to a list

while verIndex < verAmountTotal:
    try:
        nextVer = (versions[verIndex]) 
        nextVerCompare = (versions[verNextIndex])
    except IndexError:
        verNextIndex -= 1

    if nextVer[0:24] == nextVerCompare[0:24]:
        if nextVer[-3:] < nextVerCompare [-3:]:
            filteredVersions.append(nextVerCompare)
        else:
            filteredVersions.append(nextVer)  



    verIndex += 1
    verNextIndex += 1

我的预期输出是:

print filteredVersions
['MRS_103_005_010_BG_001_v002', 'MRS_103_005_010_FG_001_v003']
['MRS_103_005_020_BG_001_v003']

实际输出为:

print filteredVersions
['MRS_103_005_010_BG_001_v002', 'MRS_103_005_010_FG_001_v002', 
'MRS_103_005_010_FG_001_v003']

['MRS_103_005_020_BG_001_v002', 'MRS_103_005_020_BG_001_v003']

在 with 循环期间,我在通过 verIndex 引用的每个文件夹上使用 os.list。我认为问题在于正在为每个搜索的文件夹生成一个列表,但我希望将所有搜索组合在一个列表中,然后通过 groupby 和 sorted 操作。

标签: pythonlist

解决方案


似乎是一个案例itertools.groupby

from itertools import groupby

grouped = groupby(data, key=lambda version: version.rsplit('_', 1)[0])
result = [sorted(group, reverse=True)[0] for key, group in grouped]

print(result)

输出:

['MRS_103_005_010_BG_001_v002',
 'MRS_103_005_010_FG_001_v003',
 'MRS_103_005_020_BG_001_v003']

这将条目按最后一个下划线之前的所有内容分组,我理解为“项目代码”。

然后,它以相反的顺序对每个组进行排序。每个组的元素仅因版本而异,因此具有最高版本号的条目将排在第一位。

最后,它从每个组中提取第一个条目,并将其放回结果list中。


推荐阅读