r - 如何使用 hunspell(或其他软件包)使用我自己的“字典”来纠正单词?
问题描述
我想根据另一个名称正确的列表更正一些拼写错误的名称。
例如,我有这样的文字:
ff Kazaroy, Sengir Pureblood S aE Didcono Ungido Ae yf Soldado do Bispo Ue ra Lamina Celeste daLegiao L
我有这个清单:
Kazarov, Sengir Pureblood/ Diácono Ungido/ Soldado do Bispo/ Lâmina Celeste da Legião
我不希望 hunspell 根据英语词典或任何词典来更正我的文本中的这些单词(因为 Kazarov 是俄语名字,有些单词是英语,有些是葡萄牙语)所以我宁愿使用我的列表作为一本字典”。我尝试使用 add_words 函数添加自定义单词。
我试过了,举个例子
text2 <- hunspell(text, dict = dictionary(add_words = "Kazarov, Sengir Pureblood")
print(text2[[1]])
hunspell_suggest(text2[[1]])
但它不仅不起作用,而且仍然使用英语词典。我正在考虑以某种方式创建一个自定义字典,但我觉得它不会很有效(而且我什至不知道该怎么做)。
有什么建议么?
解决方案
我认为问题在于:
dictionary(add_words = "Kazarov, Sengir Pureblood")
add_words
应该是一个字符向量。
尝试:
dictionary(add_words = c("Kazarov", "Sengir", "Pureblood"))
看起来它仍然与 Kazarov/Kazaroy 有问题,但其他两个词没问题。
推荐阅读
- mysql - 自加入表并计算返回值
- typescript - 在使用 TypeScript 的绑定函数中无法正确识别“thisArg”上下文
- php - 检查php中的内置函数
- r - Huxtable:quick_xlsx 导出后不显示数据
- c# - 如何在 Asp Net Core 中将 XML 输出从存储过程转换为 C# 对象
- api - 如何使用 Expo 连接到您的 React Native 中的 API?
- r - 无法从 R 中的 GitHub 加载 *.Rda 文件
- analytics - Azure DevOps Server - 谁通过历史更改了特定字段
- ubuntu - 我们可以为 Ubuntu 20.04 安装 Microsoft SQL ODBC 驱动程序版本 11 吗?
- vue.js - 将数据从子组件传递到父组件真的有必要发出吗?