deep-learning - 如何使用 Fasttext 构建 lemmatizer
问题描述
我在阿拉伯语方言中有大量单词(4M)及其对应的词条,我想通过利用它为不在该数据中的新词构建词条分析器。问题是如何使用 FastText 来构建这个词形还原器?
解决方案
我认为 fasttext 对于词形还原任务没有用:词嵌入对语料库中的词没有语法知识。
相反,您应该考虑使用经典的 NLP 库,例如 Spacy 或 NLTK。
推荐阅读
- calendar - Microsoft graph calender api - 使用电子邮件地址读取所有用户的事件
- maven - Maven - 为什么jar文件与war文件一起生成?
- powerbi - PowerQuery List.Generate:参数评估的顺序?
- r - 找不到函数“lucas_Lehmer2”
- ssl - 在 centOS 7.x 上使用 https 配置的 AWX-Ansible
- jmeter - 如何为jmeter中的每个不同响应代码保存示例响应?
- mongodb - 如何根据猫鼬中的id从对象数组中获取一个对象
- javascript - 错误:在连接传输之前无法发送 - SignalR
- android - Android 11:DecoratedMediaCustomViewStyle 忽略 setCustomContentView
- python - 在不中断 tkinter 中 GUI 更新的情况下运行耗时的脚本