python - 如何为以下标记的 pos 应用分块?(nltk)
问题描述
from nltk import word_tokenize, pos_tag, pos_tag_sents
tagged_pos = pos_tag_sents(map(word_tokenize, data))
tagged_pos
以下是 pos 标签:[('dpdb', 'NN'),('engine', 'NN'),('bottom', 'NN'),('power', 'NN'),('gain ', 'NN'),('curve', 'NN'), ('every', 'DT')],[('dpdb', 'NN'),('engine', 'NN'),( 'center', 'NN'),('power', 'NN'),('gain', 'NN'), ('curve', 'NN'),('every', 'DT')]]
我试过:
grammar = "NP: {<DT>?<JJ>*<NN>}"
chunk_parse = nltk.RegexpParser(grammar)
chunked=[]
for s in tagged_pos:
chunked.append(chunk_parse.parse(s))
得到以下输出: 警告:解析空文本 警告:解析空文本 警告:解析空文本 警告:解析空文本 警告:解析空文本 警告:解析空文本 警告:解析空文本
解决方案
推荐阅读
- docker - 使用 Docker 跨多台机器设置 Elasticsearch 集群
- php - 在 p 标签内回显 php 变量,在 p 标签外返回
- roql - ROQL 查询中的 Concat
- servicenow - 如何在 ServiceNow 中找到 show_in_menu.xml Formatter 文件?
- sql - 查询分隔,然后在 postgresql 中计算逗号分隔值的字段
- cookies - 本地存储(在浏览器中)的 cookie 可以查看我的浏览历史记录吗?
- javascript - 悬停时底部显示三角形之后/之前的图像
- c# - 使用 .NET Core 在 Visual Studio Code 中进行调试时如何捕获输入
- javascript - Adding Buttons dynamically HTML
- hadoop - 使用 copyToLocal 从 HDFS 复制的路径