machine-learning - BLEU 分数如何运作?. 它与简单的基于 Jaccard 分数的相似性预测有何不同?
问题描述
我试图理解 BLEU score 的概念。然后我找到了这篇写的文章
“该方法通过计算候选翻译中匹配的 n-gram 与参考文本中的 n-gram 来工作,其中 1-gram 或 unigram 将是每个标记,而 bigram 比较将是每个单词对。”
但这与计算两个文本的相似度分数的 jaccard 分数几乎相同。
有人可以解释一下 BLEU 分数是如何工作的,以及它与基于 Jaccard 分数的相似性度量的区别。
解决方案
推荐阅读
- unix - UNIX shell 脚本读取 csv
- git - 使用 Jenkins 管道将文件夹从旧分支复制到 SCM 正在使用的分支中
- macos - 无法在 macOS 上将 AAC/AptX 编解码器用于蓝牙音频
- azure-devops - 在包更新时触发构建
- python - pyftpsync 在输出中添加 ESC 字符
- aws-cli - AWS QuickSight 新的 api 操作最近宣布在 CLI 1.16.200 中不可用
- python-3.x - Lambda 超时配置在使用 chalice 部署时重置为 1
- python - 将 Python Tkinter-Treeview 中的行提取到 Pandas 数据框中
- google-bigquery - BigQuery - 计算来自 IoT 设备的活动块
- javascript - 当使用 jquery .val() 方法设置对象字段时,Jquery ajax post 发送 null