python - 合并几个txt。用于主题建模的多行文件到一个 csv 文件(1 行 = 1 个文档)
问题描述
到目前为止,我有 30 个文本文件,它们都有多行。我想根据本教程应用 LDA 模型。所以,对我来说,它应该是这样的:
text of document1
text of document2
text of document3
.....
text of document30
但是特定文档的整个文本必须在一行上。
我试过这篇文章,由于某种原因,它一直在说:csv_output.writerow(row[1] for row in csv_text) IndexError: list index out of range
。有什么想法吗?当然,我以相同的方式命名文档并编辑了范围。
基本上,我不在乎我们是否可以用 python 解决这个问题。我已经筋疲力尽了,所以我非常感谢每一个帮助
解决方案
我不确定您要完成什么,但是要删除文本文件的换行符并使用结果制作一个大文本文件,以下内容应该可以工作:
for i in *.txt; do NEW=` cat $i | tr '\n' ' '` ; echo $NEW >> output.txt; done
推荐阅读
- sql-server - SQL Server 2017 触发器 - 声明变量
- android - 在运行时验证 android 库的 (aar) 签名
- c - Windows 桌面 API 和 C 运行时库之间的区别?
- javascript - 如何使用 showErrors 函数显示集中的错误消息并更改输入边框颜色
- php - 仅当 url 中没有其他参数时才使用 htaccess 路由
- swift - Swift Generic Type Equatable 通过对数组进行排序
- r - 我怎样才能使数据框中的一个因素永久地成为数字?
- android - 如何从 Android App Bundle 中排除 ABI?
- python-3.x - concurrent.futures.Future 可以转换为 asyncio.Future 吗?
- c# - 在满足某些条件之前选择最后 n 个元素