python - 如何将此打印语句转换为数据框?Python NLP LSA 主题
问题描述
我需要将这些 LSA 主题添加到我的数据框中的每个相应主题中。如何在数据框中获取此打印语句输出?
--> 我正在尝试在不同的列中获取包含主题编号及其相应关键字的数据框。
# most important words for each topic
vocab = vect.get_feature_names()
for i, comp in enumerate(lsa_model.components_):
vocab_comp = zip(vocab, comp)
sorted_words = sorted(vocab_comp, key= lambda x:x[1], reverse=True)[:3]
print("Topic "+str(i)+": ")
for t in sorted_words:
print(t[0],end=" ")
print("\n")
话题一:xxx yyy zzz。. . 话题 8:fddd dddd dsdsd
话题 9: 啊啊啊啊啊啊啊
解决方案
将以下行添加到工作环境的顶部:
import pandas as pd
headings=['Name_of_Variable1','Name_of_Variable2'] # add more as needed
df = pd.DataFrame([], columns=headings)
并且,在您的函数中添加以下行或类似内容for t in sorted_words:
df = df.append(t,ignore_index=True)
看起来像:
for t in sorted_words:
print(t[0],end=" ")
df = df.append(t,ignore_index=True)
print("\n")
请使用以下材料正确使用附加功能:https ://www.geeksforgeeks.org/python-pandas-dataframe-append/
推荐阅读
- iis - 如何在 IIS/Plesk 上将签名算法更改为 SHA-2
- csv - CSV 查找并保存到新文件
- python - urllib.error.URLError:
- mysql - BigQuery 中 MySQL 的 binary(8) 和 varbinary(16) 的等价物是什么?
- azure - 在 Azure Function 中编写视频
- c# - 使用公钥和私钥发送加密和签名的电子邮件,以便在 FMCSA 中提交数据
- pyqt5 - 从 QtWebEnginePage 获取重定向 url
- java - 存储与项目相关的图像的正确方法
- java - Intellij Idea,主要功能JAVA的另一个文件合并
- java - RunTimeException 以外的代码覆盖率未覆盖