首页 > 解决方案 > 为部落语言词性标注创建语料库

问题描述

我正在使用 NLTK 从文本字符串中提取名词,并且它的每个单词已经在(ibaloi)语言中包含 POS 标签,这些标签稍后用于创建语法:

sentence = "this is a tribal language"
words = nltk.word_tokenize(sentence)
taggedWords = tagged_text = nltk.pos_tag(nltk.Text(words))

英文没有问题。有没有办法让它在部落(ibaloi)语言中也能工作?

(我是自然语言过程的新手,正在学习一些很棒的教程。)

标签: pythonnlpnltkcorpus

解决方案


您可能想参考这个类似的问题,其中 OP 也有一个单词列表,其中包含 Excel 文件中的单词和词性(名词、动词等),用于一种不在 NLTK 中的语言。


推荐阅读