python - 为部落语言词性标注创建语料库
问题描述
我正在使用 NLTK 从文本字符串中提取名词,并且它的每个单词已经在(ibaloi)语言中包含 POS 标签,这些标签稍后用于创建语法:
sentence = "this is a tribal language"
words = nltk.word_tokenize(sentence)
taggedWords = tagged_text = nltk.pos_tag(nltk.Text(words))
英文没有问题。有没有办法让它在部落(ibaloi)语言中也能工作?
(我是自然语言过程的新手,正在学习一些很棒的教程。)
解决方案
您可能想参考这个类似的问题,其中 OP 也有一个单词列表,其中包含 Excel 文件中的单词和词性(名词、动词等),用于一种不在 NLTK 中的语言。
推荐阅读
- ruby-on-rails - Rails 查询连接到内部表计数
- powerbi - Power BI DAX 按日期汇总和筛选
- r - update.packages 无法更新为旧版 R 构建的现有包
- angularjs - 制作 Angular 指令/组件(ng1 和 ng2)需要特定的父指令/组件
- c++ - CopyFile 到自定义位置,存在字符串转换问题
- r - r中的嵌套dplyr循环
- python - 如何将Resnet50模型分成两部分,然后在pytorch中按顺序训练数据?
- laravel - Laravel - 如何解决有效负载中的意外语法错误
- react-native - 如何解决“Apple Developer Portal 身份验证失败!”?
- unity3d - Unity:仅围绕对象 y 轴旋转,但有问题的对象已经改变了旋转