首页 > 解决方案 > BPEmb - 获取句子嵌入。自然语言处理

问题描述

我正在使用 BPEmb 多语言模型来获取句子嵌入。据我了解,该模型仅返回单词嵌入,我必须自己创建句子嵌入。我尝试了一种简单的平均方法,它的表现非常好。但我认为有一种更正确的方法来嵌入句子?

from bpemb import BPEmb
multibpemb = BPEmb(lang="multi", vs=1000000, dim=300)
vec_sent = multibpemb.embed("I like icream. Ich mag Eis.")
vec_sent.shape
>> (9, 300)
np.average(vec_sent, axis=0).reshape(300,1).shape
>> (300, 1)

标签: pythonnlpmultilingualtext-classificationembedding

解决方案


推荐阅读