antlr - 这个 ANTLR 语法有什么问题?
问题描述
我想解析如下所示的查询表达式:
人名=%约翰%
(人名=John% 和地址=%Ontario%)
Person Fullname_3="约翰·C·史密斯"
但我对 Antlr4 完全陌生,甚至不知道如何解析一个 TABLE FIELD=QUERY 子句。当我在 Go 作为目标中运行下面的语法时,我得到
line 1:7 mismatched input 'Name' expecting {'not', '(', FIELDNAME}
对于一个简单的查询,如
人名=约翰
为什么语法不能通过解析 fieldsearch->field EQ searchterm->FIELDNAME 来解析 FIELDNAME?
我想我在这里误解了关于 Antlr Grammars 如何工作的一些非常基本的东西,但是什么?
/* ANTLR Grammar for Minidb Query Language */
grammar Mdb;
start : searchclause EOF ;
searchclause
: table expr
;
expr
: fieldsearch
| unop fieldsearch
| LPAREN expr relop expr RPAREN
;
unop
: NOT
;
relop
: AND
| OR
;
fieldsearch
: field EQ searchterm
;
field
: FIELDNAME
;
table
: TABLENAME
;
searchterm
: STRING
;
AND
: 'and'
;
OR
: 'or'
;
NOT
: 'not'
;
EQ
: '='
;
LPAREN
: '('
;
RPAREN
: ')'
;
fragment VALID_ID_START
: ('a' .. 'z') | ('A' .. 'Z') | '_'
;
fragment VALID_ID_CHAR
: VALID_ID_START | ('0' .. '9')
;
TABLENAME
: VALID_ID_START VALID_ID_CHAR*
;
FIELDNAME
: VALID_ID_START VALID_ID_CHAR*
;
STRING: '"' ~('\n'|'"')* ('"' | { panic("syntax-error - unterminated string literal") } ) ;
WS
: [ \r\n\t] + -> skip
;
解决方案
尝试使用 . 查看为该输入生成的令牌grun Mdb tokens -tokens
。它会告诉您输入由两个表名、一个等号和另一个表名组成。为了匹配您的语法,它需要是一个表名、一个字段名、一个等号和一个字符串。
第一个问题是,TABLENAME
并且FIELDNAME
具有完全相同的定义。在两个词法分析器规则会在当前输入上产生相同长度的匹配的情况下,ANTLR 更喜欢语法中第一个出现的匹配。所以它永远不会产生FIELDNAME
令牌。要解决这个问题,只需用一条规则替换这两个ID
规则。如果你愿意,你可以引入解析器规则tableName : ID ;
,fieldName : ID ;
如果你想保留名称。
另一个问题更直接:John
根本不匹配字符串的规则,因为它不在引号中。如果您确实希望允许John
作为有效的搜索词,您可能希望将其定义为searchterm : STRING | ID ;
而不是仅允许STRING
s。
推荐阅读
- c# - 存储具有相同唯一标识符(“用户名”)的两个域模型(用户)时克服不一致的最佳方法
- c# - 将项目动态添加到表 asp MVC
- cpanel - 在 Cpanel 中的插件域后无法托管我的新网站
- selenium - 如何根据 TestNG Assert 结果使用 Log4j 级别?
- javascript - 有条件地更改禁用的按钮样式
- c# - 验证解决方案项目之间没有文件引用
- javascript - 随机选择的事件结果
- node.js - 找不到模块'./Gulp'
- apache-camel - 在不指定协议、主机和端口的情况下配置 Camel Jetty endoint
- android - Android Pie - 9 (API 28) : 安装 APK .... 未成功安装