python - 将泡菜文件转换为 csv 会产生常规的 UnicodeEncodeErrors
问题描述
我下载了 Reuters-full-data-set 并生成了 pkl 文件。在 Windows 10 命令提示符中使用脚本 ('dump_to_csv.py') 将 pkl 文件转换为 csv 可以达到一定程度,但时不时地(为了舒适而使用太多次),它会抛出一个错误,现在是代码我正在使用(来自 GitHub 存储库)已更新以修复 Python 3 中的错误,但是错误仍然存在(至少对我而言)。在 Windows 10-Pro(64 位)中使用 Python 3.6.4。“dump_to_csv.py”文件的代码位于此处https://github.com/philipperemy/Reuters-full-data-set/blob/master/dump_to_csv.py
这些错误都非常相似,即:
Traceback (most recent call last):
File "dump_to_csv.py", line 41, in <module>
read(sys.argv[1])
File "dump_to_csv.py", line 34, in read
w.write(line)
File "C:\Users\...\AppData\Local\Programs\Python\Python36\lib\encodings\cp1252.py", line 19, in encode
return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode characters in position 31-47: character maps to <undefined>
谢谢你的帮助。
解决方案
推荐阅读
- node.js - 使用 node.js 传递多个参数时的错误值 NaN
- linux - ubuntu 16.04上的Openstack安装错误
- html - CSS 将元素的宽度设置为前一个子元素的 110%
- javascript - 带有 express/reactjs/nextjs 的 SSR - 最佳方法
- c++ - 在 QtCreator 中错误使用未声明的标识符“主窗口”语义问题
- javascript - 相同的函数不同的 MD5 哈希结果
- python - 在 Tkinter (Python3) 中循环声明按钮
- c++ - 字符串复制构造函数与从 string_view 构造字符串的成本
- image-processing - 旧 JPG 文件仅适用于 VB6 Leadtools
- swift - AVPlayer 本地视频预览调试错误