nlp - PolyAnalyst:是否有词性标签列表?
问题描述
有人可以提供分配给_tagged
创建的列的 Pos Tagger 标签列表吗?我们需要知道可以分配的所有可能值以及每个值的含义。例如:En_NN = noun
,En_NNS = plural noun
等。
对于_chunked
列(NP、VP、PP 等)也是如此
_low_chunked
与/列类似_top_chunked
(Np、Vp、Jp、Rp 等)
解决方案
_parsed - 解析器的结果。每个标记用空格分隔,句子用空行分隔。
_tagged - postagging 的结果。在每个标记之后通过斜线作为其标记。标签的含义:
常见的
规格 | 任何特殊符号
点 | 任何标点符号
粒子
En_NEG | 否定词(非)
En_TO | 不定式
恩_AT | 文章(a an the)
恩_OF | 介词(在)
En_CC | 连词协调(和或)
英文_CS | 从属连词(即作为)
恩_UH | 感叹词(哎呀)
数字
恩_CD | 红衣主教(一)
恩_OD | 序数(第一)
名词
恩_NN | 单数主格(cat)
En_NNS | 复数主格 (cats)
恩_NN$ | 单数属格(cat's)
恩_NNS$ | 复数属格(cats')
形容词
恩_JJ | 积极(温暖)
中文_JJR | 比较(温暖)
英文_JJT | 最高级的(最温暖的)
副词
En_RB | 积极的(廉价的)
En_RBR | 比较(便宜)
En_RBT | 最高级的(最便宜的)
动词
En_MD | 模态(可能)
英文_VB | 不是第三个或复数(去)
En_VBZ | 第三单数(去)
En_VBD | 过去式(去)
中文_VBN | 过去分词(消失)
中文_VBG | 现在分词(去)
代词
恩_PP | 主格(它他她你我们)
恩_PP$ | 所有格(我们的,他的,他们的,我的,你的)
En_PPO | 宾格(他们是他我我们你她你)
En_PPL | 反身的(自己自己自己自己)
_chunked、_low_chunked、_top_chunked - 是不同级别的分块算法。top_chunked - 最上面的短语,它被构造为小基本块的联合。
POS tagger chunker 标签是: Np - 名词短语 Vp - 动词短语 Jp - 形容词短语 Rp - 副词短语 Pp - 介词短语 Sp - 连词短语
推荐阅读
- java - 使用 GSON 按键访问 JSON 元素
- python-3.x - Pandas - 你如何对多列进行抱怨并获得最低值?
- python - 在 dag 之间使用单独的 environ 和 sys.path
- ruby-on-rails - 有没有办法测试 PostCSS Autoprefixer 是否工作?专门针对 Rails 6
- python - 如何以较短的列表重复的方式将两个不同长度的列表相乘?
- c# - 创建用户控件时,是否应该在视图和代码隐藏之间使用数据绑定?
- android - 如何在第二个活动中获取 String.xlm 文件?
- git - 如何从 Azure Devops 中的特定分支构建?
- google-apps-script - 根据另一个工作表值填充单元格
- python - 如何在我的环境中设置与基本环境不同的 Python 版本?