python-3.x - 什么是自然语言处理上下文中的词注入,它的应用是什么?
问题描述
您好所有社区成员,
在浏览了各种文章和博客之后,我了解到假设在语料库 ( C1
) 中,假设存在一个单词 ( w
)。现在同一个词 ( w
) 也出现在另一个相关的语料库 ( C2
) 中。同样,语料库中存在n
单词数。
通过单词注入,我的理解是:-w
语料库(C1)中的单词()被其修改版本(.w
)替换,并在语料库()中分配了一些特殊字符,例如(.
,_
或$
)C2.
。
注:词(.w
)的修改版本不属于语料库 C1 和 C2。该词与其他上下文中使用的词.w
相同。w
这是 NLP 中单词注入的正确解释吗?
例如,单词system
被替换为_system
。
我希望这是词注入的正确定义。python中是否存在任何方法来实现上述概念?
任何帮助表示赞赏。
解决方案
推荐阅读
- python - Numpy:随机数生成 - 将循环分成块
- java - 使用 spring 集成从 wmq 获取 JMS 目标
- c - C 函数不工作
- mysql - 您如何在 sequelize 中包含带有其他条件的 concat 调用?
- django - 无法为 Django 的重置密码流程创建集成测试
- java - JUnit 5 TestFactory 迭代器
- wordpress - WordPress Grabity 表单 gform_after_submission
- coldfusion - Testbox 2.1 - 跳过整个目录或 CFC 文件
- reactjs - 基本理解——React 应用中公共目录的位置
- angular - 如何在不需要 rxjs-compat 的情况下只导入 RxJS 6 中使用的运算符,如旧的 RxJS?