java - 当您使用朴素贝叶斯算法拼错单词时,获取字典(数据库)的接近单词
问题描述
当用户拼错单词时,我想使用朴素贝叶斯进行文本分类以获取字典(数据库)的接近单词。例如:用户输入“sheese”,输出将是“cheese”。
请问我该怎么用?知道我的项目是在 java 中。
谢谢,任何建议或意见。
解决方案
朴素贝叶斯不能做到这一点。这不是分类任务。目标变量可以是任何具有正确拼写的变量。
即使您找到了一些解决方法来完成这项工作,您最终也会得到一个非常无用的模型,因为它可能会为您之前决定的极少数单词提供输出。还有其他拼写纠正技术可以做到这一点。一种好的技术是https://github.com/wolfgarbe/SymSpell
推荐阅读
- mailgun - Mailgun SMTP:从邮件中删除 Src 标记
- github - GitHub 组织的自定义位置文本
- terraform - 如何在 Terraform 中包含策略 json 文件?
- discord.js - 从 module.exports 调用 .json
- html - 以文本形式插入 HTML 时的 SVG 宽度和高度
- c# - 使用 C# 分配内存(在内核中运行驱动程序)
- sql - 在 hive 窗口中,如果 CURRENT ROW 的值小于 UNBOUNDED PRECEDING 的值会发生什么
- html - 如何使用 Flexbox 在其他项目之上显示一个项目?
- heroku - Nginx 在代理 heroku 应用程序时重定向(301)而不是代理
- python - 如何以玩家在 TDS 中查看的方式发射弹丸