首页 > 解决方案 > 将泡菜文件转换为 csv 会产生常规的 UnicodeEncodeErrors

问题描述

我下载了 Reuters-full-data-set 并生成了 pkl 文件。在 Windows 10 命令提示符中使用脚本 ('dump_to_csv.py') 将 pkl 文件转换为 csv 可以达到一定程度,但时不时地(为了舒适而使用太多次),它会抛出一个错误,现在是代码我正在使用(来自 GitHub 存储库)已更新以修复 Python 3 中的错误,但是错误仍然存​​在(至少对我而言)。在 Windows 10-Pro(64 位)中使用 Python 3.6.4。“dump_to_csv.py”文件的代码位于此处https://github.com/philipperemy/Reuters-full-data-set/blob/master/dump_to_csv.py

这些错误都非常相似,即:

Traceback (most recent call last):
  File "dump_to_csv.py", line 41, in <module>
    read(sys.argv[1])
  File "dump_to_csv.py", line 34, in read
    w.write(line)
  File "C:\Users\...\AppData\Local\Programs\Python\Python36\lib\encodings\cp1252.py", line 19, in encode
    return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode characters in position 31-47: character maps to <undefined>

谢谢你的帮助。

标签: pythoncsvunicodepython-3.6pickle

解决方案


推荐阅读