python - 根据相似性为单词分配类别
问题描述
我有大约 100 万个句子的语料库。比方说:-
第一句:“曼城与曼联之间的激烈较量以平局告终”
我想根据上述消息属于“体育”类别的类别分配句子,并再次将其分配给体育中的“足球”类别等其他类别。我想将文本分为“娱乐”、“体育”、“政治”、“科技”四个类别。我使用了 Word2vec 的方法,但它只能说明两个句子之间的关系。我怎么能做到这一点?我没有任何预定义的标记数据,只有数百万条记录。我真的想做这样的事情
解决方案
推荐阅读
- python - 如何能够导入谷歌驱动器文件夹中的每个文件?
- reactjs - React 项目结构的最佳实践?
- python - 使用 Blender API 保存 .3ds 或 .obj 文件
- hyperledger-fabric - Fabric make error etcd:不包含包 go.etcd.io/etcd/etcdserver/api/snap
- reactjs - 在没有外部依赖的情况下反应本机去抖钩子
- c# - 带有 id 的 ASP.NET WebAPI 2 版本控制 POST
- c# - 在 C# .NET Core 中检查文件权限
- xcode - 如何快速访问其他类中的变量?
- mongodb - mongodb - 集合的唯一字段覆盖文档
- python - Python Selenium:如何设置基于 DIV 的编辑器的文本?