python - 交叉引用街道和城市名称
问题描述
我有一个数据框,其中包含每个城市的城市和街道列表。我正在尝试将城市名称与街道名称交叉引用。以下是列表的简化示例。
City name Street name
London Street A
London Street B
London Berlin Street
Paris Street C
Paris Street D
Paris London Street
Berlin Street E
Berlin Street F
Berlin Paris Street
输出应该是这样的:
Street A in City A, City B, City C...
因为我有大约 150 个城市和大约 15 000 条街道要覆盖,所以这样做最耗时(迭代花费的时间最少)是什么?
另外,由于我不是来自英语国家,因此某些城市名称的街道具有更改城市名称最后几个字母的后缀。像这样的东西:inflat e - > inflatable 覆盖这些名称是一个很好的解决方法。
我对这两个问题的任何想法都持开放态度:)
编辑:我的数据看起来像这样。所以我列出了每个城市都有自己的街道。
NASELJE_NAZIV(city) ULICA_NAZIV(Street)
GROP_VRSTA
1 BELI MANASTIR A. AUGUSTINČIĆA
1 BELI MANASTIR A. CESARCA
1 BELI MANASTIR ADOLFA WALDINGERA
1 BELI MANASTIR ALOJZIJA STEPINCA
1 BELI MANASTIR ANTE STARČEVIĆA
1 BELI MANASTIR BANA JELAČIĆA
1 BELI MANASTIR BARANJSKA
1 BELI MANASTIR BARTOKA BELE
1 BELI MANASTIR BELI MANASTIR PLANINA
1 BELI MANASTIR BELIŠĆANSKA ULICA
1 BELI MANASTIR BRAČKA ULICA
1 BELI MANASTIR BRANKA GAVELLE
1 BELI MANASTIR DONJOMIHOLJAČKA ULICA
1 BELI MANASTIR DORE PEJAČEVIĆ
1 BELI MANASTIR DRAVSKA
1 BELI MANASTIR DR. KAMILA FIRINGERA
1 BELI MANASTIR DUNAVSKA
1 BELI MANASTIR ĐAKOVAČKA ULICA
1 BELI MANASTIR EUGENA SAVOJSKOG
1 BELI MANASTIR FRANA KRSTE FRANKOPANA
解决方案
在更改后缀中,您可以使用 FuzzyWuzzy 库 https://github.com/seatgeek/fuzzywuzzy
推荐阅读
- java - Java Streams:覆盖 Collectors.mapping 的返回类型
- android - 等待进程出现在模拟器问题上超时
- r - 在 R 中准备时间序列数据
- google-apps-script - 如何从 Google Sheet 将数据注入 Google Slides?追加列表还是直接函数?
- python - 数据框图 - 由于日期索引而产生的直线
- spring-data - @Transactional noRollbackFor EmptyResultDataAccessException.class 不起作用
- android - 在android应用程序中显示pdf而不下载它并且不使用网络视图
- python - 跳过循环的一部分
- javascript - 验证密码要求时启用表单提交按钮
- r - 按性别和区域绘制平均长度,并使用 Rmisc 包绘制平均值 +/- 1 标准误差的误差条