首页 > 解决方案 > 我正在寻找用于技术产品审查的荷兰语标记器

问题描述

我正在尝试为荷兰语 NLP 问题找出更好的文本清理方法。我使用荷兰语版本的 pos 标签和 nltk 来删除停用词。但我没有得到想要的结果。

标签: nlptokenizesentiment-analysis

解决方案


你试过这种荷兰语的方法吗?

from nltk.util import ngrams
from nltk.corpus import alpino
print(alpino.words())
quadgrams=ngrams(alpino.words(),4)
for i in quadgrams:
    print(i)


推荐阅读