python - 标记荷兰语单词
问题描述
阅读这篇文章,我发现我可以使用荷兰语句子标记器,如下所示:
nltk.download('punkt')
tokenizer = nltk.data.load('tokenizers/punkt/dutch.pickle')
tokernizer.tokenize('Ik liep naar huis. Dat deed ik gisteren')
但是有没有办法使用荷兰语单词标记器?英文版(默认的“punkt”)似乎可以工作,但我猜它在某些时候可能会出错。
解决方案
推荐阅读
- php - Symfony 3.4 - 有没有办法为 ChoiceType 创建一个自动递增的 id?
- linux - Bash 脚本剪切和文件名未硬编码
- vue.js - Vuetify 数据表操作行
- linux - 在 Linux 中安装 .run 文件
- python - ValueError:检查输入时出错:预期dense_18_input的形状为(784,)但得到的数组形状为(1,)
- c# - 使用 Unity SerializedProperties 获取和设置 System.Object 值
- python - 如何从主题分布比较 Python Gensim 中两个文档的主题相似性?
- python - 使用 Keras ImageDataGenerator 时多输入模型中的内存错误
- c++ - NTL 库 GF2X
- python - 在降价中,有没有办法加粗多个标点符号(不是单词/数字)?