首页 > 解决方案 > 使用 flex 和 bizon 的基本 PHP 类解释器。减少/减少和转移/减少冲突

问题描述

我正在编写一个类似 PHP 的解释器,并且在 shift/reduce 和 reduce/reduce 冲突方面存在一些问题。有人可以帮我理解 shift/reduce 和 reduce/reduce 冲突。

我必须编写和解释发送/回显非值并评估以“魔术” @字符开头的表达式,例如@if(cond) ... @end; . 所以必须回显“if” ,而应该解释@if(cond)

问题:scriptlang.y 包含 21 个移位/归约冲突和 2 个归约/归约冲突。

%union {
    char* sval;
}
%token <sval> IDENTIFIER
%token <sval> RBRACKET
%token <sval> LBRACKET
%token <sval> KWSWITCH
%token <sval> KWIF
%token <sval> MAGICESC
%token MAGIC
%token ENDSTM

%type <sval> filechar

%start script

%%
script:
   commands
;
commands:   
    /* empty */
    | command 
    | commands command
;
command:
    filechar {
        analyser_echo($1,"filechar",analyser_canEcho);
    }
    | magic_command {}
;
filechar:
    IDENTIFIER
    | LBRACKET
    | RBRACKET
    | KWSWITCH
    | KWIF
    | MAGICESC
;
magic_command:
    MAGIC valuation
    | MAGIC alternative
;
valuation:
    LBRACKET IDENTIFIER RBRACKET {
        fprintf(yyout, "<val>");
    }
;
alternative:
    switch_alternative
    | if_alternative
;
switch_alternative:
    switch_block end_stm
;
switch_block:
    switch_stm
    | switch_stm commands
;
switch_stm:
    KWSWITCH LBRACKET IDENTIFIER RBRACKET {}
;
if_alternative:
    if_block end_stm
;
if_block:
    if_stm
    | if_stm commands
;
if_stm:
    KWIF LBRACKET IDENTIFIER RBRACKET {}
;
end_stm:
    ENDSTM
;
%%

弹性文件内容:

"@@" {
    yylval.sval = "@"; 
    return MAGICESC;
}
"@" {
    return MAGIC;
}
"(" {
    yylval.sval = yytext; 
    return LBRACKET;
}
")" {
    yylval.sval = yytext; 
    return RBRACKET;
}
"@end;" { 
    return ENDSTM;
}
"if" {
    yylval.sval = yytext; 
    return KWIF;
}
"switch" {
    yylval.sval = yytext; 
    return KWSWITCH;
}
[a-zA-Z][_a-zA-Z0-9]* {
    yylval.sval = yytext; 
    return IDENTIFIER;
}
\n|. {
    if(analyser_canEcho>0){
        ECHO;
    }
}
%%

标签: bisonflex-lexer

解决方案


导致冲突的基本问题是您对commands. 您的意图是定义commands为零或多个commands,其编写如下:

commands: %empty
        | commands command

如果你打算坚持至少有一个命令,你会写:

commands: command
        | commands command

混合这两种形式是行不通的,因为解析器不知道command是以什么都没有 ( %empty) 或单个s 开头的 s 序列command。您应该尝试准确理解为什么这会导致模棱两可;您会在此站点上找到许多类似问题的示例。例如,看到这个问题

这会产生 21 个移位/减少冲突。减少/减少冲突是好奇产生的结果:

switch_block: switch_stm commands
if_block: if_stm commands

ifswitch语句是序列中的单个command元素;or语句commands后面的内容将是. 定义包含以下命令是完全模棱两可的:实际上,它是说下一个可能仍然是 的一部分,或者它可能是.switchifcommandcommandsswitch_blockcommandswitch_blockcommandswitch_block


上面,我专门解决了您提出的问题:您的语法中的解析表冲突。你的语法和词汇规范还有其他各种问题,我强烈建议你学习你收到的关于 bison/flex 的任何材料,和/或阅读bisonflex手册。

作为阅读手册或其他材料的指南,我建议您至少关注两件事:

  1. 语义值的处理。句法关键字永远不需要将自己的表示形式作为语义值;实际上,句法关键字很少需要语义值。如果一个标记确实要求它的语义值是它的表示,你需要记住它yytext是一个指向你不拥有的私有数据缓冲区的指针,它将被修改而不发出警告。因此需要复制。

  2. 像您的 PHP 变体这样的嵌入式语言涉及两种不同的词法上下文。您有一个外部的、本质上未解释的上下文,以及一个包含在@和之间的嵌入式上下文@end;。(F)lex 提供了开始条件来帮助处理这种嵌入。该手册有一些示例,并且该站点周围还有更多示例。


推荐阅读