python - 抓取网站时尝试对位置进行编码/解码
问题描述
我试图抓取一个网站,并在 url 中获取城市和社区的参数。这些参数以以下编码显示:
城市例如 - %E7%E9%F4%E4 邻里例如 - %E1%FA+%E2%EC%E9%ED
我试图寻找这种格式是什么,但找不到答案。
任何帮助我解码/编码这种类型的工具的想法,或者这个编码名称甚至是什么都会有所帮助。
注意:我使用 python 抓取
编辑和更多信息:这似乎是因为位置在希伯来语中,并且 url 库正在解析它以使其成为有效的 url。尝试使用 python 来复制我所做的这个动作:
>>> import urllib.parse
>>> diction = {"City": "חיפה"}
>>> urllib.parse.urlencode(diction)
输出是:
'City=%D7%97%D7%99%D7%A4%D7%94'
这似乎是朝着正确方向迈出的一步,但仍然与网站本身使用的编码不同。