python - 我正在尝试根据列('structure')组合列('cleaned_instruction')中的文本
问题描述
我正在尝试columb
根据列(结构)对(cleaned_instruction)中的文本进行分组。例如,为、等cleaned_instruction
组合在一起。Service Bay
Spillway
这是我已经能够做到的。但它并没有我想出现的那么有效。
#function for combining texts
def combine_text(list_of_text):
combined_text = ' '.join(list_of_text)
return combined_text
#converted dataframe to dictionary to combine
Data_combined = {key: [combine_text(value)] for (key, value) in Data.items()}
print(Data_combined)
#reconverted back into DF and sorted...
data_df = pd.DataFrame.from_dict(Data_combined, orient='index',
columns=['Structure'])
data_df.columns = ['cleaned_instruction']
data_df = data_df.sort_index()
data_df
关于如何根据类别更好地将文本分组为一个的任何帮助?
解决方案
推荐阅读
- swift - 父 NSManagedObjectContext 必须使用 NSPrivateQueueConcurrencyType 或 NSMainQueueConcurrencyType
- javascript - 在产品过滤器旁边显示正确的计数
- c# - 使用和等待使用有什么区别?我如何决定使用哪一个?
- python - 如何找到分组的数据框的两列行的交集并从包含它的单元格中删除该值?
- debian-buster - Debian buster 和 libgfortran3
- git - npm 和 git 需要发布“node_modules”(依赖)?
- java - 尽管库包含在 pom 中,但在 maven 项目中找不到类
- c++ - 如何记录 C++20 模块中的功能?
- selenium-webdriver - 在 selenium 中不是有效的 xpath 表达式问题
- r - 更新到 macOS Catalina (10.15) 后出现 Rmarkdown Pandoc 错误