python - 如何使用向量表示通过聚类关键字对描述中的单词进行分组
问题描述
目前我正在开发一个系统,使用 python Bert 嵌入来可视化特定领域的学术研究趋势。
我有样本数据,其中包含关键字集群和作者出版物的原始数据集,可将 700 个数据分组。
我想根据示例关键字对原始数据集中描述列中的每个单词进行分组,并使用矢量表示按作者姓名表示。
以下是我拥有的示例关键字:
以下是我想要实现的输出:
这是我的数据集的链接: https ://drive.google.com/drive/folders/1jOc8nhcwnjSYF_fMzQQ0Zeid1r7ST41T?usp=sharing
帮助表示赞赏!
解决方案
推荐阅读
- javascript - Heroku:可能的匿名代理隐藏节点应用程序上的连接 IP
- python - 如何在 AWS 中正确处理 NotAuthorizedException
- react-native - 传递状态值作为道具反应原生
- node.js - 无法在 nodejs 上使用用 emscripten 编译的 js 库,但如果我启动交互式 nodejs shell,它就可以工作
- java - 登录在 Spring Security 的自定义登录页面中不起作用
- java - Mp3 文件不会在 Linux 上使用 jlayer 转换为 .wav,但会在 macOS 上
- php - 设置选择输入值 unsing php echo
- hadoop - Apache Zeppelin 失败 java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration
- jsf - commandButton actionListener 在 Primefaces 10.0 中不起作用
- docker - 为什么我的 nextflow 脚本中的奇点拉取失败?