句法分析
1、句法是研究句子的每个组成部分和它们之间的组合方式;
常用的句法分析形式为:短语结构分析(phrase structure parsing)和依存分析(dependency parsing);
单词:终结符;词性(动名词等):预终结符;其他句法标记:非终结符;
短语结构树可以转换为依存树;
句法分析:归根结底,就是句子成分的分析,以及对句子中各个成分内部、外部关系的判断;
句法分析包括三个重要概念:
形式化的文法:描述语言结构的定义,由文法规则组成;
符号串:词串,由分词系统组成;
分析:使用形式文法对符号串进行分析的具体方法,即实现分析的计算机算法;
2、上下文无关文法
句法树结构表达了对句子结构的归纳过程,这个过程用计算机实现需要使用形式文法;
形式文法包括:无限制文法(0型文法)、上下文相关文法(1型文法)、上下文无关文法(2型文法)和正规文法(3型文法)