python-3.x - NLTK 访问本地文件;UnicodeDecodeError:“charmap”编解码器无法解码位置 834 中的字节 0x9d:字符映射到
问题描述
这是我的第一篇文章,我几乎没有经验,但我喜欢学习。我希望这篇文章是可以理解的,但请随时询问更多详细信息。
我正在使用 Cygwin,偶尔会使用 IDLE Python 3.9 来完成一些大学任务。目前我正在尝试使用 NLTK 模块并标记文本。
我做的第一件事是打开 python(通过 Cygwin 或直接从 IDLE,但我主要使用 Cygwin)。
>>>import nltk
>>> from nltk import word_tokenize
>>> from nltk.book import *
此时将下载一个包含不同书籍的图书馆供我访问。不过,我真的不需要它们,因为我需要访问一个名为“Tint”的文件夹中的本地文件
我已经设法执行但无法复制的命令是
>>>Rev = open("/Users/acer/OneDrive - Università di Pavia/Desktop/Tint/amazon_jamon.no_alterations.txt", "r").read()
过去,我遇到的第一个问题是由于反斜杠而使用转义命令,但是当我将其修复为常规斜杠时,它会起作用。现在我试图访问同一个“Tint”文件夹中的类似 .txt 文件,通过这个命令我得到一个不同的错误。
>>> desc = open("/Users/acer/OneDrive - Università di Pavia/Desktop/Tint/salame_
P.txt", "r").read()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python\Python 395\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 834: char
acter maps to <undefined>
解决方案
推荐阅读
- android - 为什么通知 PendingIntent 不起作用?
- ios - Xcode 模拟器没有显示 swift ui 占位符文本
- vb.net - VB.NET/Access - 检查每行的第一个值是否小于特定值,然后将文本添加到数据表中的每个对应行
- java - 如何根据单选按钮的选择显示/隐藏文本字段?
- regex - 什么是与 $ 元字符相关的“字符串结尾换行符”?
- java - 更改 JSF SessionScoped Bean 的值以注销用户
- java - 将文件从资产复制到内部存储
- vba - VBA在循环中组合列堆栈
- flutter - 我如何在颤动中制作自定义开关按钮?
- linux - 在 bash 脚本中使用 for 循环在多行命令中插入行