首页 > 解决方案 > 正则表达式(python):如何匹配某些查询

问题描述

我有一个字符串列表,其中每一行都是这样的:

1.alfa.america.game

我需要用不同的参数查询这一行,如果匹配,打印出来。在这个例子中,我得到了所有有“1”和“db”的行,但也得到了其他的,即:

11.alfa.cad.base

我不想得到带有“11”或“db”的行,只有完全匹配。这就是我所做的:

代码:

    ID = "1"
    task = "db"
    environment = "a-z"
    location = "a-z"
    fullString = "1.alfa.america.game" #this string can change

    q = re.compile(r'(['+ID+'])+.(['+task+'])+.(['+environment+'])+.(['+location+'])+.', flags=re.I | re.X)
m = q.match(fullString)
if m:
    print (fullString)

提前致谢!

标签: pythonregexmatch

解决方案


关于模式的一些注释,其中一些已经在评论中提到。

使用当前变量,模式将是

([1])+.([db])+.([a-z])+.([a-z])+.
  • 在这里,.匹配任何字符而不是仅匹配点。
  • 如果您不想匹配 11,则不应为组或字符类使用量词
  • 重复捕获组()+将捕获最后一次迭代的值,您希望将组值作为一个整体,以便您可以重复字符类
  • 由于字符串喜欢1db是硬编码的,因此您实际上不必捕获它们

考虑到这一点,您可以改用 2 个捕获组。当您使用re.match时,您可以在开头省略锚点并使用断言字符串的结尾\Z

1\.db\.([a-z]+)+\.([a-z]+)\Z
  ^    ^          ^
  Dot  group 1    group 2

正则表达式演示

q = re.compile(ID+r'\.'+task+'\.(['+environment+']+)+\.(['+location+']+)\Z', flags=re.I)

推荐阅读