python - 如何使用 txt 文件而不是文章?(Python)
问题描述
我写了一个阅读文章和自学AI的代码。首先,我阅读带有 URL 的文章并下载它。然后我解析文章并将其用于我的 AI 学习文本。但是现在我想从 txt 文件中读取文本。如何将 txt 文件的文本分配给 Article 对象?(请检查代码以清除我的愿望)谢谢大家。
article = Article('URL for article')
article.download()
article.parse()
article.nlp()
corpus = article.text
text= corpus
sentence_list = nltk.sent_tokenize(text)
PS:我想使用 txt 文件而不是 URL。但我不会从代码中删除文章,因为它再次是必要的。
解决方案
我尝试了很多选项,但唯一的方法是不使用文章。所以我删除文章部分并像这样进行更改:
f = open("visp.txt", "r",encoding="utf8")
#article = Article('visp.txt')
#article.download()
#article.parse()
#article.nlp()
#corpus = article.text
f = open("demo.txt", "r",encoding="utf8")
corpus = f.read()
print(corpus)
PS:打开.txt文件时不要忘记编码。
推荐阅读
- python - 向我的数组追加或插入随机元素
- c++ - 运行时错误:以下代码的运行时错误分段错误 (SIGSEGV)
- c# - Pulumi 本地工作区配置值,这些是否适用于 Azure 部署?
- python - 如何使用 environment.yaml 文件在 Python 中创建虚拟环境?
- amazon-s3 - 如何限制 S3 分段上传总大小
- amazon-s3 - 如何确定 s3 文件是否已使用服务器端加密进行加密
- javascript - Sql Server - 约束 - Sequelize - 仅当 B 列为空时才允许设置 A 列,反之亦然
- python - NotImplementedError:无法将符号张量转换为 numpy 数组
- python - 在路径列表中查找一个数字
- events - 使用 REDIS 进行即发即弃的消息模型