首页 > 解决方案 > 合并几个txt。用于主题建模的多行文件到一个 csv 文件(1 行 = 1 个文档)

问题描述

到目前为止,我有 30 个文本文件,它们都有行。我想根据本教程应用 LDA 模型。所以,对我来说,它应该是这样的:

text of document1
text of document2
text of document3 
.....
text of document30

但是特定文档的整个文本必须在一行上。

我试过这篇文章,由于某种原因,它一直在说:csv_output.writerow(row[1] for row in csv_text) IndexError: list index out of range。有什么想法吗?当然,我以相同的方式命名文档并编辑了范围。

基本上,我不在乎我们是否可以用 python 解决这个问题。我已经筋疲力尽了,所以我非常感谢每一个帮助

标签: pythonexport-to-csvtext-miningldatopic-modeling

解决方案


我不确定您要完成什么,但是要删除文本文件的换行符并使用结果制作一个大文本文件,以下内容应该可以工作:

for i in *.txt; do NEW=` cat $i | tr '\n' ' '` ; echo $NEW  >> output.txt; done

推荐阅读