首页 > 解决方案 > 什么是自然语言处理上下文中的词注入,它的应用是什么?

问题描述

您好所有社区成员,

在浏览了各种文章和博客之后,我了解到假设在语料库 ( C1) 中,假设存在一个单词 ( w)。现在同一个词 ( w) 也出现在另一个相关的语料库 ( C2) 中。同样,语料库中存在n单词数。

通过单词注入,我的理解是:-w语料库(C1)中的单词()被其修改版本(.w)替换,并在语料库()中分配了一些特殊字符,例如(._$C2.

注:词(.w)的修改版本不属于语料库 C1 和 C2。该词与其他上下文中使用的词.w相同。w

这是 NLP 中单词注入的正确解释吗?

例如,单词system被替换为_system

我希望这是词注入的正确定义。python中是否存在任何方法来实现上述概念?

任何帮助表示赞赏。

标签: python-3.xnlpnltkwordcorpus

解决方案


推荐阅读