python - 无法更改语言以获得所需的输出
问题描述
我在 python 中编写了一个脚本来获取站点的内容(采用表格格式)。当我执行我的脚本时,它会成功解析该内容。我唯一不能修改的是语言选项。
该网站的内容是Arabic
语言。但是,我的意图是以这样的方式解析它,以便我得到的输出是英文的。这就是我卡住的地方。headers={"Accept-Language":"en-US,en;q=0.9"}
我根据this answer尝试过,但在这种情况下似乎不起作用。如何更改语言选项以达到目的?
这是我的脚本:
import requests
from bs4 import BeautifulSoup
URL = "http://www.awm.gov.jo/dotnet/default.aspx"
req = requests.get(URL,headers={"Accept-Language":"en-US,en;q=0.9"})
soup = BeautifulSoup(req.text,"lxml")
for items in soup.select("#GV_prices tr"):
data = [item.get_text(strip=True) for item in items.select("th,td")]
print(data)
仅供参考,这是headers={"Accept-Language": "en-US,en;q=0.5"}
我的第一次尝试,但也没有用。
解决方案
您正在尝试接受美式英语的网站,要获得阿拉伯语,您可以尝试将接受语言设置为“ar”。但是,这不会为您将页面翻译成英文。
推荐阅读
- python - numpy.array(object, dtype=None, *, copy=True, order='K', subok=False, ndmin=0, like=None)
- ansible - Ansible 创建字符串而不是列表
- python - 如何在从 Django Queryset 构建的 Pandas DataFrame 中包含`@cached_property`?
- excel - 如何在“范围内的每个单元格”循环中调用函数
- javascript - 在显示多个自适应卡时,在 Microsoft bot 框架对话框中出现代理撤销错误
- python - 请求和 PhantomJS 不返回完整的 html 代码
- javascript - 如何在我的两个字符串之间放置一个空格?
- kubernetes - 在部署中挂载秘密
- javascript - Jest 在依赖项中遇到了一个意外的标记
- django - Django Rest Framework (DRF) 拒绝在更新 (PUT) 请求中使用外键验证数据