首页 > 解决方案 > 如何使用 txt 文件而不是文章?(Python)

问题描述

我写了一个阅读文章和自学AI的代码。首先,我阅读带有 URL 的文章并下载它。然后我解析文章并将其用于我的 AI 学习文本。但是现在我想从 txt 文件中读取文本。如何将 txt 文件的文本分配给 Article 对象?(请检查代码以清除我的愿望)谢谢大家。

article = Article('URL for article')
article.download()
article.parse()
article.nlp()
corpus = article.text

text= corpus
sentence_list = nltk.sent_tokenize(text)

PS:我想使用 txt 文件而不是 URL。但我不会从代码中删除文章,因为它再次是必要的。

标签: pythonpython-3.xnltkpython-newspapernewspaper3k

解决方案


我尝试了很多选项,但唯一的方法是不使用文章。所以我删除文章部分并像这样进行更改:

f = open("visp.txt", "r",encoding="utf8")

#article = Article('visp.txt')
#article.download()
#article.parse()
#article.nlp()
#corpus = article.text


f = open("demo.txt", "r",encoding="utf8")
corpus = f.read()
print(corpus)

PS:打开.txt文件时不要忘记编码。


推荐阅读