首页 > 解决方案 > 根据相似性为单词分配类别

问题描述

我有大约 100 万个句子的语料库。比方说:-

第一句:“曼城与曼联之间的激烈较量以平局告终”

我想根据上述消息属于“体育”类别的类别分配句子,并再次将其分配给体育中的“足球”类别等其他类别。我想将文本分为“娱乐”、“体育”、“政治”、“科技”四个类别。我使用了 Word2vec 的方法,但它只能说明两个句子之间的关系。我怎么能做到这一点?我没有任何预定义的标记数据,只有数百万条记录。我真的想做这样的事情

标签: pythonnlptext-classificationlda

解决方案


推荐阅读