首页 > 解决方案 > PolyAnalyst:是否有词性标签列表?

问题描述

有人可以提供分配给_tagged创建的列的 Pos Tagger 标签列表吗?我们需要知道可以分配的所有可能值以及每个值的含义。例如:En_NN = noun,En_NNS = plural noun等。

对于_chunked列(NP、VP、PP 等)也是如此

_low_chunked与/列类似_top_chunked(Np、Vp、Jp、Rp 等)

标签: nlptaggingpos-taggerpart-of-speech

解决方案


_parsed - 解析器的结果。每个标记用空格分隔,句子用空行分隔。

_tagged - postagging 的结果。在每个标记之后通过斜线作为其标记。标签的含义:

 

常见的

规格 | 任何特殊符号

点 | 任何标点符号

   

粒子

En_NEG | 否定词(非)

En_TO | 不定式

恩_AT | 文章(a an the)

恩_OF | 介词(在)

En_CC | 连词协调(和或)

英文_CS | 从属连词(即作为)

恩_UH | 感叹词(哎呀)

   

数字

恩_CD | 红衣主教(一)

恩_OD | 序数(第一)

   

名词

恩_NN | 单数主格(cat)

En_NNS | 复数主格 (cats)

恩_NN$ | 单数属格(cat's)

恩_NNS$ | 复数属格(cats')

   

形容词

恩_JJ | 积极(温暖)

中文_JJR | 比较(温暖)

英文_JJT | 最高级的(最温暖的)

   

副词

En_RB | 积极的(廉价的)

En_RBR | 比较(便宜)

En_RBT | 最高级的(最便宜的)

   

动词

En_MD | 模态(可能)

英文_VB | 不是第三个或复数(去)

En_VBZ | 第三单数(去)

En_VBD | 过去式(去)

中文_VBN | 过去分词(消失)

中文_VBG | 现在分词(去)

   

代词

恩_PP | 主格(它他她你我们)

恩_PP$ | 所有格(​​我们的,他的,他们的,我的,你的)

En_PPO | 宾格(他们是他我我们你她你)

En_PPL | 反身的(自己自己自己自己)

_chunked、_low_chunked、_top_chunked - 是不同级别的分块算法。​top_chunked - 最上面的短语,它被构造为小基本块的联合。

POS tagger chunker 标签是: Np - 名词短语 Vp - 动词短语 Jp - 形容词短语 Rp - 副词短语 Pp - 介词短语 Sp - 连词短语


推荐阅读