首页 > 解决方案 > 列表中的 Python 模式自动匹配

问题描述

我正在尝试编写一个小脚本来将具有相似模式的字符串组合在一起。以下是我的程序片段,它工作正常,但有点不准确。

lst = ["report-2020.10.13", "report-2020.12.12", "analytics-2020.12.14", "sales-cda87", "analytics-2020.11.21", "sales-vu7sa"]

final = []
for pat in lst:
    pat = pat[:len(pat) // 2]
    ils = []
    for pat2 in lst:
        if pat2.startswith(pat):
            ils.append(pat2)
    final.append(tuple(ils))

finalls = list(set(final))
for f in finalls:
    print(f)

另外,我想要对字符串进行分组的确切字符串模式。例如,从["rep-10-01", "rep-10-02", "rep-11-06"]我想要的字符串列表中"rep-"作为模式。是否需要改进?或者任何可以帮助我解决第一个和第二个问题的库/模块?提前致谢。

标签: python-3.xstringtexttext-processing

解决方案


这是否按您的预期工作:


    from collections import defaultdict
    
    res = defaultdict(str)
    
    lst = ["report-2020.10.13", "report-2020.12.12", "analytics-2020.12.14",
           "sales-cda87", "analytics-2020.11.21", "sales-vu7sa"]
    
    #ll = ['rep-10-01', 'rep-10-02', 'rep-11-06']
    
    
    for pat in lst:
        pattern = pat.split('-')
        #print(pattern[0])  # real pattern - eg. report, sales, analytics
        
        res[pattern[0]] += pat+ ', '
        
    print(res)

      Output: 
    defaultdict(<class 'str'>, {'report': 'report-2020.10.13, report-2020.12.12, ', 'analytics': 'analytics-2020.12.14, analytics-2020.11.21, ', 'sales': 'sales-cda87, sales-vu7sa, '})

推荐阅读