首页 > 解决方案 > 无法更改语言以获得所需的输出

问题描述

我在 python 中编写了一个脚本来获取站点的内容(采用表格格式)。当我执行我的脚本时,它会成功解析该内容。我唯一不能修改的是语言选项。

该网站的内容是Arabic语言。但是,我的意图是以这样的方式解析它,以便我得到的输出是英文的。这就是我卡住的地方。headers={"Accept-Language":"en-US,en;q=0.9"}我根据this answer尝试过,但在这种情况下似乎不起作用。如何更改语言选项以达到目的?

这是我的脚本:

import requests
from bs4 import BeautifulSoup

URL = "http://www.awm.gov.jo/dotnet/default.aspx"

req = requests.get(URL,headers={"Accept-Language":"en-US,en;q=0.9"})
soup = BeautifulSoup(req.text,"lxml")
for items in soup.select("#GV_prices tr"):
    data = [item.get_text(strip=True) for item in items.select("th,td")]
    print(data)

仅供参考,这是headers={"Accept-Language": "en-US,en;q=0.5"}我的第一次尝试,但也没有用。

标签: pythonpython-3.xweb-scrapingbeautifulsoup

解决方案


您正在尝试接受美式英语的网站,要获得阿拉伯语,您可以尝试将接受语言设置为“ar”。但是,这不会为您将页面翻译成英文。


推荐阅读