首页 > 解决方案 > 这个 ANTLR 语法有什么问题?

问题描述

我想解析如下所示的查询表达式:

人名=%约翰%

(人名=John% 和地址=%Ontario%)

Person Fullname_3="约翰·C·史密斯"

但我对 Antlr4 完全陌生,甚至不知道如何解析一个 TABLE FIELD=QUERY 子句。当我在 Go 作为目标中运行下面的语法时,我得到

line 1:7 mismatched input 'Name' expecting {'not', '(', FIELDNAME} 

对于一个简单的查询,如

人名=约翰

为什么语法不能通过解析 fieldsearch->field EQ searchterm->FIELDNAME 来解析 FIELDNAME?

我想我在这里误解了关于 Antlr Grammars 如何工作的一些非常基本的东西,但是什么?

/* ANTLR Grammar for Minidb Query Language */

grammar Mdb;

start : searchclause EOF ;

searchclause
    : table expr
    ;

expr
    : fieldsearch
    | unop fieldsearch
    | LPAREN expr relop expr RPAREN
    ;

unop
    : NOT
    ;

relop
    : AND
    | OR
    ;

fieldsearch
    : field EQ searchterm
    ;

field
    : FIELDNAME
    ;

table
    : TABLENAME
    ;

searchterm
    : STRING
    ;

AND
    : 'and'
    ;

OR
    : 'or'
    ;

NOT
    : 'not'
    ;
EQ
    : '='
    ;

LPAREN
    : '('
    ;

RPAREN
    : ')'
    ;

fragment VALID_ID_START
    : ('a' .. 'z') | ('A' .. 'Z') | '_'
    ;

fragment VALID_ID_CHAR
    : VALID_ID_START | ('0' .. '9')
    ;

TABLENAME
    : VALID_ID_START VALID_ID_CHAR*
    ;

FIELDNAME
    : VALID_ID_START VALID_ID_CHAR*
    ;

STRING: '"' ~('\n'|'"')* ('"' | { panic("syntax-error - unterminated string literal") } ) ;

WS
   : [ \r\n\t] + -> skip
;

标签: antlrantlr4context-free-grammar

解决方案


尝试使用 . 查看为该输入生成的令牌grun Mdb tokens -tokens。它会告诉您输入由两个表名、一个等号和另一个表名组成。为了匹配您的语法,它需要是一个表名、一个字段名、一个等号和一个字符串

第一个问题是,TABLENAME并且FIELDNAME具有完全相同的定义。在两个词法分析器规则会在当前输入上产生相同长度的匹配的情况下,ANTLR 更喜欢语法中第一个出现的匹配。所以它永远不会产生FIELDNAME令牌。要解决这个问题,只需用一条规则替换这两个ID规则。如果你愿意,你可以引入解析器规则tableName : ID ;fieldName : ID ;如果你想保留名称。

另一个问题更直接:John根本不匹配字符串的规则,因为它不在引号中。如果您确实希望允许John作为有效的搜索词,您可能希望将其定义为searchterm : STRING | ID ;而不是仅允许STRINGs。


推荐阅读