首页 > 解决方案 > Python 将 Ã3 编码为 ó

问题描述

我有一个字符串

' La empresa de capitales mixtos que el predio de residuos, Ceamse, aclarÃ3 este martes que la responsabilidad del desentendimiento con los recicladores informes que provocÃ3 un nuevo bloqueo y hace peligrar la recolecciÃ3n '

你需要这个

' La empresa de capitales mixtos que el predio de residuos, Ceamse, aclaró este martes que la responsabilidad del desentendimiento con los recicladores informes que provocó un nuevo bloqueo y hace peligrar la recolección '

我怎么能用 Python 做到这一点?

谢谢!

标签: pythondecodeencode

解决方案


您需要修复您的网页抓取脚本!

看起来 La Capital 发送了正确的 http 标头和 html 标头信息,并且内容是 UTF-8 编码的。所以你的脚本需要处理它,一切都会正常工作。

我从经验中知道 requests.get 和 beautifulsoup 4 都可以很好地处理 Unicode,所以只需调试你的脚本,看看哪里出错了。检查原始输入,检查您是否需要页面的 .content 或 .text,并相应地修复它。


推荐阅读