antlr - grun 无法识别 ANTLR4 Unicode 解析
问题描述
鉴于以下情况:
grammar Lang
start: CHAR;
CHAR: [\uE001];
WS: [ \t\r\n]+ -> skip;
当此批处理文件运行时:
@echo off
setlocal
call antlr4 -o .\javatarget LangFile.g4 -encoding UTF-8
cd .\javatarget
call javac LangFile*.java
call grun LangFile Lang -gui -diagnostics -trace -encoding UTF-8
endlocal
@echo on
当我粘贴 Unicode 字符时会发生此错误:
^Z
line 1:0 token recognition error at: '?'
enter Lang, LT(1)=<EOF>
consume [@0,3:2='<EOF>',<-1>,2:0] rule Lang
exit Lang, LT(1)=<EOF>
尽管我搜索了其他答案(例如 -encoding 选项),但我似乎无法让这种 Unicode(私人使用区域)解析工作。
编辑:我有 4.8 版。
问题似乎出在 grun 工具上。使用 Python 手动运行它运行良好,指定输入文件也是如此。但是直接将内容粘贴到控制台会失败。恢复使用输入文件对我来说已经足够了,但是当 grun 的直接输入模式工作时,也许这个问题得到了回答。
解决方案
可能是您的grun
脚本如何处理输入的问题,因为当我生成词法分析器和解析器并运行它时:
LangLexer lexer = new LangLexer(CharStreams.fromString("\uE001"));
LangParser parser = new LangParser(new CommonTokenStream(lexer));
parser.start();
它解析时没有任何警告或错误。