首页 > 解决方案 > 无法打开本地 .txt 文件以在 NLTK 中读取

问题描述

我不是一个经验丰富的程序员,我只是想用它来用 NLTK 进行一些数据分析。我正在关注在线书籍,但以下代码无法打开读取文件。

#download nltk

import nltk
nltk.download()

#import everything from nltk
from nltk.book import *

import io
open('ALL FEMALES1.txt', encoding="ISO-8859-1")

输出:<_io.TextIOWrapper name='ALL FEMALES1.txt' mode='r' encoding='ISO-8859-1'>

我试过用

f = open('ALL FEMALES1.txt')
>>> raw = f.read()

但这给了我以下错误:'utf-8' codec can't decode byte 0xd5 in position 18929: invalid continuation byte

有什么建议吗?如果这很重要,我正在使用 Jupyter Notebook。

标签: pythonnlpnltk

解决方案


打开文件可以很好地完成

with open('sample_file.txt', encoding="ISO-8859-1") as f:
    print(f.read())

推荐阅读