首页 > 解决方案 > Python RegEx 从地址中拆分街道和号码

问题描述

我想拆分街道和号码。

这是我目前的解决方案:

matches = re.match(r'^(?<street>[^,]*?)[,\s]*(?P<number>\d[\w\s\-/]*$)', street_number)

但它不适用于某些情况。如果我有这样的例子:

working_examples = [
    'Somestreet 1',
    'Somestreet1',
    'Somestreet1a',
    'Somestreet 1a',
    'Somestreet 1 a'
]

print(matches.groupdict())打印 working_examples 的第一个元素:

{'street': 'Somestreet', 'number': '1'}

但是在这种情况下:

not_working_examples = [
    'Some 1 street',
    'Some 1a street'
]

它打印

{'street': 'Some ', 'number': '1 street'}

我的目标是拥有

{'street': 'Some 1 street', 'number': None}

标签: pythonregex

解决方案


import re


examples = [
    'Somestreet 1',
    'Somestreet1',
    'Somestreet1a',
    'Somestreet 1a',
    'Somestreet 1 a',
    'Some 1 street',
    'Some 1a street'
]

for s in examples:
    matches = re.match(r'^(?P<street>.+?)[,\s]*(?P<number>\d\s?\w?)$', s)
    if matches:
        print(matches.groups())
    else:
        print s, "doesn't match"

输出:

('Somestreet', '1')
('Somestreet', '1')
('Somestreet', '1a')
('Somestreet', '1a')
('Somestreet', '1 a')
Some 1 street doesn't match
Some 1a street doesn't match

演示和解释


推荐阅读