python - 标记和复合词的向量表示
问题描述
我有一个句子语料库。它们中的每一个都可能包含标记的复合词。例如:
这是一个 example_sentence,后跟另一个 awesome_paragraph
. 我想获得所有标记和复合词的嵌入向量
(this, is, an, example, sentence, follow, by, another, awesome, paragraph, example_sentence, awesome_paragraph)
我可以用 gensim 或我应该使用哪个库来做到这一点吗?
解决方案
推荐阅读
- android - 从 JSON 响应改造中获取字符串数据
- c++ - 如何删除cin后的一行?
- ios - 如何在越狱的 iOS 环境中对所有其他应用程序进行浮动视图?
- python - 如何将python中的视频分成4个相等的部分?
- javascript - 对 JavaScript 中除一个元素之外的数组进行排序
- python - 无法使用 Seaborn 绘图
- c# - 多个 REST API 方法可以共享同一个控制器类吗?
- c++ - 在 WIFI_AP_STA 中设置 AP 和 STA 之间的路由
- node.js - npm 命令在 Windows 上的 Ubuntu 上的 Bash 上不起作用(WSL)
- perl - 如何在 Perl 中打印数组的完整内容