首页 > 解决方案 > grun 无法识别 ANTLR4 Unicode 解析

问题描述

鉴于以下情况:

grammar Lang
start: CHAR;
CHAR: [\uE001];
WS: [ \t\r\n]+ -> skip;

当此批处理文件运行时:

@echo off
setlocal
call antlr4 -o .\javatarget LangFile.g4 -encoding UTF-8
cd .\javatarget
call javac LangFile*.java
call grun LangFile Lang -gui -diagnostics -trace -encoding UTF-8
endlocal
@echo on

当我粘贴 Unicode 字符时会发生此错误:


^Z
line 1:0 token recognition error at: '?'
enter   Lang, LT(1)=<EOF>
consume [@0,3:2='<EOF>',<-1>,2:0] rule Lang 
exit    Lang, LT(1)=<EOF>

尽管我搜索了其他答案(例如 -encoding 选项),但我似乎无法让这种 Unicode(私人使用区域)解析工作。

编辑:我有 4.8 版。

问题似乎出在 grun 工具上。使用 Python 手动运行它运行良好,指定输入文件也是如此。但是直接将内容粘贴到控制台会失败。恢复使用输入文件对我来说已经足够了,但是当 grun 的直接输入模式工作时,也许这个问题得到了回答。

标签: antlrantlr4

解决方案


可能是您的grun脚本如何处理输入的问题,因为当我生成词法分析器和解析器并运行它时:

LangLexer lexer = new LangLexer(CharStreams.fromString("\uE001"));
LangParser parser = new LangParser(new CommonTokenStream(lexer));

parser.start();

它解析时没有任何警告或错误。


推荐阅读