python-3.x - 西班牙 POS 标记器 CESS,我如何在我的代码中实现它
问题描述
我正在处理这个文本“处理任务”,其中涉及将句子标记化并用西班牙语标记词性。我已经编写了一个有效的代码(遵循一些在线教程),但是 POS 标签是用于英语的,并且不能正确地标记为西班牙语单词。所以,我的问题是,我怎样才能指示 python 使用西班牙 Cess 模块?
我已经导入了 NLTK 标记器、pos_tag、pos_tag_sents 和 from nltk.corpus import cess_esp as cess
我想使用这段代码,因为它确实保存了 {token,POS} 的元组,但只需向其中添加西班牙语 pos 标签。我真的很感激任何反馈。非常感谢!
df['text']
tagger = cess
texts = df['text'].tolist()
tagged_texts = pos_tag_sents(map(word_tokenize, texts))
tagged_texts
df['POS'] = tagged_texts
pos_tag_sents( df['text'].apply(word_tokenize).tolist() )
df['POS'] = pos_tag_sents( df['text'].apply(word_tokenize).tolist() )
解决方案
推荐阅读
- python - cassie机器人强化学习控制的分段错误(核心转储)
- javascript - 使用 - moment JS 和 Angular 获取特定年份的月份中的天数
- python - selenium.common.exceptions.WebDriverException:消息:无效参数:无法终止退出的进程 [NOT A DUPLICATE]
- android - 如何检查实时数据库中的值(开/关)
- algorithm - 合并 k 排序数组 - 优先队列与传统合并排序合并,何时使用哪个?
- sinch - 如何在对 PSTN 的 Javascript Sinch SDK 调用中接收脉冲
- database - 恢复数据库而不转储但文件 --> /var/lib/mysql
- c++ - 为了修复此代码,我应该更改或删除什么以便其余的可以正常工作?
- c# - 在 c# 中,如何为我的客户端应用程序设置正确的肥皂 WS 寻址命名空间,从 a:... 到 wsa:
- php - 在 WooCommerce 中获取和显示相关产品