parsing - 解析和词性标注有什么区别?
问题描述
我知道 POS 标记用适当的词性标记句子中的每个单词,但解析器不也是这样做的吗?即,将一个句子分成其组成部分?我在网上查到了这个,但找不到任何令人满意的解释。请清除我的疑问。提前致谢
解决方案
它们是两个不同的过程:
POS 标记:每个标记都被分配一个反映其词类的标签。
解析:每个句子都被分配一个结构(通常是一棵树),它反映了它的组成部分是如何相互关联的。
POS 标记采用标记化的单词序列,并返回带注释的标记列表,其中每个标记都有一个单词类别标签。这通常通过查看令牌周围的上下文来消除歧义。
还有chunking,它将标记分组到相关的组中(例如名词短语)。块是不重叠的序列。
解析通常会产生一个句子的解析树;在模棱两可的句子的情况下,通常可能有许多可能的树。
词性标注通常是解析中的一个准备步骤,因为解析器通常对单词类进行操作(尽管有一些解析算法可以直接使用标记,或者混合使用标记和标记)。
推荐阅读
- html - 如何在html视频标签中添加视频标题
- javascript - required 属性是否应该适用于表单内的模板自定义输入?
- python - Python3.8.2 编译 Cython 扩展错误 - 警告:'tp_print' 已弃用
- javascript - PHP数组json_encode数组对象到Javascript字符串
- python - 如何创建具有变化幅度和相位的合成余弦波?
- java - 如何实现滑动删除手势,完全如 Material Design 的文档中所示?
- javascript - 如何将键值对映射到对象中的每个索引
- javascript - ListFooterComponent 不能正常工作?
- python - Jupyter Notebook 中的 Python 相对导入
- laravel - 对工厂内的其他属性使用默认工厂属性值