python - 使用scrapy时如何处理特殊字符?
问题描述
我正在抓取一些西班牙语网站,并且有一些特殊字符,例如:ñ 或 ó。我正在使用此代码,但是当我将 csv 文件导出为 excel 时,不会出现特殊字符。
这是之后如何在 excel 中查看文件的一些示例。而不是ñ,它出现了ñ。
解决方案
您的脚本应该没问题。问题是Excel默认使用cp1252打开csv文件,而Python将文件存储在utf-8中。计算机只能存储数字,而操作系统和软件使用一个称为字符编码的特殊表格来找出如何将数字转换为字母和字符。CP1252 和 utf-8 是众多字符编码标准中的两个。在这种情况下,ñ 有一个 utf-8 编码 0xC3 0xB1,而在 cp1252 中它被解释为 ñ。
如果你想用 utf-8 打开 csv 文件,你应该在 Excel 中选择 File-Import,而不是在 File Origin 下拉菜单中选择 Unicode(UTF-8)。
推荐阅读
- asp.net - 下拉菜单没有被选中
- javascript - 默认函数参数
- javascript - 如何使用 HTML 中触发的 swift/cordova 代码打开 URL?(通过Javascript?)
- javascript - Javascript - 定时器在 5 秒后禁用
- c# - Identity Server 4 Asp.Net Identity + EF Core 未播种
- reporting-services - SSRS:我可以通过拖放 .rdl 文件快速更新我的报告吗?
- c# - 在 excel 中查找重复的行并使用 power shell 将这些行导出到另一个工作表
- ios - 斯威夫特 - 不能调用选择器..为什么?
- javascript - 如何在 Angular 7 应用程序中集成 Apache Superset Charts?身份验证和标头问题
- git - jenkins does not trigger build when a new tag is pushed on the same commit