首页 > 解决方案 > 交叉引用街道和城市名称

问题描述

我有一个数据框,其中包含每个城市的城市和街道列表。我正在尝试将城市名称与街道名称交叉引用。以下是列表的简化示例。

City name       Street name

London          Street A
London          Street B
London          Berlin Street

Paris           Street C
Paris           Street D
Paris           London Street

Berlin          Street E
Berlin          Street F
Berlin          Paris Street  

输出应该是这样的:

Street A   in   City A, City B, City C...

因为我有大约 150 个城市和大约 15 000 条街道要覆盖,所以这样做最耗时(迭代花费的时间最少)是什么?

另外,由于我不是来自英语国家,因此某些城市名​​称的街道具有更改城市名称最后几个字母的后缀。像这样的东西:inflat e - > inflatable 覆盖这些名称是一个很好的解决方法。

我对这两个问题的任何想法都持开放态度:)

编辑:我的数据看起来像这样。所以我列出了每个城市都有自己的街道。

            NASELJE_NAZIV(city)             ULICA_NAZIV(Street)
GROP_VRSTA                                       
1           BELI MANASTIR         A. AUGUSTINČIĆA
1           BELI MANASTIR              A. CESARCA
1           BELI MANASTIR       ADOLFA WALDINGERA
1           BELI MANASTIR       ALOJZIJA STEPINCA
1           BELI MANASTIR         ANTE STARČEVIĆA
1           BELI MANASTIR           BANA JELAČIĆA
1           BELI MANASTIR               BARANJSKA
1           BELI MANASTIR            BARTOKA BELE
1           BELI MANASTIR   BELI MANASTIR PLANINA
1           BELI MANASTIR       BELIŠĆANSKA ULICA
1           BELI MANASTIR            BRAČKA ULICA
1           BELI MANASTIR          BRANKA GAVELLE
1           BELI MANASTIR   DONJOMIHOLJAČKA ULICA
1           BELI MANASTIR          DORE PEJAČEVIĆ
1           BELI MANASTIR                 DRAVSKA
1           BELI MANASTIR    DR. KAMILA FIRINGERA
1           BELI MANASTIR                DUNAVSKA
1           BELI MANASTIR         ĐAKOVAČKA ULICA
1           BELI MANASTIR        EUGENA SAVOJSKOG
1           BELI MANASTIR  FRANA KRSTE FRANKOPANA

标签: pythonpandas

解决方案


在更改后缀中,您可以使用 FuzzyWuzzy 库 https://github.com/seatgeek/fuzzywuzzy


推荐阅读