nlp - 我们是否可以仅通过查看 512 维 Universal Sentence Encoder Vector 的特征来将乱码与有意义的句子分开?
问题描述
Universal Sentence Encoder 将句子编码为包含 512 个特征的向量。我的主张是,如果一个句子是胡言乱语,那么大多数特征将非常接近于零。但是,如果一个句子有意义,那么 512 个特征中的一些特征将远大于或远小于零。那么,我们能否仅通过查看向量特征的权重分布来决定哪个向量编码含义,哪个向量编码胡言乱语?
解决方案
推荐阅读
- python - Python Message'对象没有属性'get_body
- mysql - 按未按预期排序的顺序
- python - 从多个熊猫系列创建数据框
- javascript - 打字稿错误无法调用可能未定义的对象
- python - 将 Symengine I 转换为 python 1j
- python - 在不使用熊猫的情况下以可重用代码提取巨大的 csv 日志文件的有效方法(无内存读取)?
- javascript - 为什么使用猫鼬回调会导致两次保存数据?
- powershell - 如何使用 Powershell 将换行符分隔的文本文件转换为 csv
- php - 使用 PHP 客户端通过 Google API 客户端刷新令牌时出现“unauthorized_client”错误?
- c++ - c++:从静态库中创建共享对象