python - Python 将 Ã3 编码为 ó
问题描述
我有一个字符串
' La empresa de capitales mixtos que el predio de residuos, Ceamse, aclarÃ3 este martes que la responsabilidad del desentendimiento con los recicladores informes que provocÃ3 un nuevo bloqueo y hace peligrar la recolecciÃ3n '
你需要这个
' La empresa de capitales mixtos que el predio de residuos, Ceamse, aclaró este martes que la responsabilidad del desentendimiento con los recicladores informes que provocó un nuevo bloqueo y hace peligrar la recolección '
我怎么能用 Python 做到这一点?
谢谢!
解决方案
您需要修复您的网页抓取脚本!
看起来 La Capital 发送了正确的 http 标头和 html 标头信息,并且内容是 UTF-8 编码的。所以你的脚本需要处理它,一切都会正常工作。
我从经验中知道 requests.get 和 beautifulsoup 4 都可以很好地处理 Unicode,所以只需调试你的脚本,看看哪里出错了。检查原始输入,检查您是否需要页面的 .content 或 .text,并相应地修复它。
推荐阅读
- typescript - RxJs ErrorObservable 中的重大变化(迁移 5 -> 6)
- internet-explorer - 使用 GPO 或类似工具关闭 Internet Explorer 11 的所有网络实例
- ios - 发现意外的 Mach-o Header 代码:0x72613c21 xcode 9.2
- javascript - 打字稿和嵌套解构
- javascript - 如果 ul 中有内容,Javascript 验证文件输入的最佳方法
- java - 如何将json数组从laravel路由器传递到android studio中的android类
- python - Python中的日期时间
- python - 如何在 Python 3 中获取列表中的列表编号?
- sql - 查询从同一个表的另外两列的检查条件中获取结果
- html - 使用 HTML 标记显示来自 JSON 对象的文本