首页 > 解决方案 > 如何使用向量表示通过聚类关键字对描述中的单词进行分组

问题描述

目前我正在开发一个系统,使用 python Bert 嵌入来可视化特定领域的学术研究趋势。

我有样本数据,其中包含关键字集群和作者出版物的原始数据集,可将 700 个数据分组。

我想根据示例关键字对原始数据集中描述列中的每个单词进行分组,并使用矢量表示按作者姓名表示。

以下是我拥有的示例关键字:

在此处输入图像描述

这是我要分组的原始数据集: 在此处输入图像描述

以下是我想要实现的输出:

在此处输入图像描述

这是我的数据集的链接: https ://drive.google.com/drive/folders/1jOc8nhcwnjSYF_fMzQQ0Zeid1r7ST41T?usp=sharing

帮助表示赞赏!

标签: pythonbert-language-model

解决方案


推荐阅读