首页 > 解决方案 > 抓取网站时尝试对位置进行编码/解码

问题描述

我试图抓取一个网站,并在 url 中获取城市和社区的参数。这些参数以以下编码显示:

城市例如 - %E7%E9%F4%E4 邻里例如 - %E1%FA+%E2%EC%E9%ED

我试图寻找这种格式是什么,但找不到答案。

任何帮助我解码/编码这种类型的工具的想法,或者这个编码名称甚至是什么都会有所帮助。

注意:我使用 python 抓取

编辑和更多信息:这似乎是因为位置在希伯来语中,并且 url 库正在解析它以使其成为有效的 url。尝试使用 python 来复制我所做的这个动作:

>>> import urllib.parse
>>> diction = {"City": "חיפה"}
>>> urllib.parse.urlencode(diction)

输出是:

'City=%D7%97%D7%99%D7%A4%D7%94'

这似乎是朝着正确方向迈出的一步,但仍然与网站本身使用的编码不同。

标签: pythonpython-3.xweb-scraping

解决方案


推荐阅读