c++ - 在 boost::spirit 中正确设置期望失败的跨度
问题描述
我正在尝试向我的解析器添加错误报告,但我不知道如何针对特定规则正确执行此操作。
有问题的规则匹配形式为mag(12.5)
or的函数调用sqrt(5.38)
。有一个固定的函数名称列表,每个函数名称的解析方式都与其他的不同(time(4)
例如,只接受 int 值)。我的语法生成了一个 AST,其中每个函数都有自己的节点类型(Mag
和Sqrt
)Time
。
我的第一个实现很简单:我支持的每个功能都有一个规则。
fn %= mag | sqrt | time;
mag %= (lit("mag") >> lit('(') > double_ > lit(')'));
sqrt %= (lit("sqrt") >> lit('(') > double_ > lit(')'));
time %= (lit("time") >> lit('(') > int_ > lit(')'));
这可行,但如果输入包含不受支持的函数名称 ( hello(12)
),则规则将失败而不会出现错误。我想要的是失败的规则expectation_failure
(或类似的),这会说“预期的 mag,sqrt 或时间,得到'你好'”。
下面是我尝试生成错误。它读取任何 ident 后跟一个左括号(使用期望运算符),然后使用谓词 ineps
做两件事:根据函数名称生成正确的节点,如果名称未知则失败,从而生成expectation_failure
. 问题是 的位置expectation_failure
不是我想要的。它产生:
Expected <function parameters>
Got 12)
代替
Expected <mag, sqrt or time>
Got hello
有没有办法控制和的expectation_failure::first
值::last
?expectation_failure
或者,除了我应该使用的方法之外,还有其他方法可以报告错误吗?另外,我不明白为什么我expectation_failure
在这种情况下指向“12)”而不仅仅是“12”。
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/phoenix_operator.hpp>
#include <boost/spirit/include/phoenix_function.hpp>
#include <iostream>
#include <string>
namespace qi = boost::spirit::qi;
namespace ascii = boost::spirit::ascii;
namespace spirit = boost::spirit;
struct Mag { double val; };
struct Sqrt { double val; };
struct Time { int val; };
using Fn = boost::variant<Mag, Sqrt, Time>;
std::ostream& operator<<(std::ostream& os, const Mag& v) {
os << "mag(" << v.val << ")";
return os;
}
std::ostream& operator<<(std::ostream& os, const Sqrt& v) {
os << "sqrt(" << v.val << ")";
return os;
}
std::ostream& operator<<(std::ostream& os, const Time& v) {
os << "time(" << v.val << ")";
return os;
}
BOOST_FUSION_ADAPT_STRUCT(Mag, (double, val))
BOOST_FUSION_ADAPT_STRUCT(Sqrt, (double, val))
BOOST_FUSION_ADAPT_STRUCT(Time, (int, val))
void makeMag_(Fn& fn, double val) {
Mag s;
s.val = val;
fn.swap(Fn(s));
}
void makeSqrt_(Fn& fn, double val) {
Sqrt s;
s.val = val;
fn.swap(Fn(s));
}
void makeTime_(Fn& fn, int val) {
Time s;
s.val = val;
fn.swap(Fn(s));
}
BOOST_PHOENIX_ADAPT_FUNCTION(void, makeMag, makeMag_, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(void, makeSqrt, makeSqrt_, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(void, makeTime, makeTime_, 2)
template <typename Iterator>
struct FnParser : qi::grammar<Iterator, qi::locals<std::string>, ascii::space_type, Fn()>
{
FnParser() : FnParser::base_type(fn)
{
using qi::double_;
using qi::int_;
using qi::_val;
using qi::_1;
using qi::_a;
using qi::_r1;
using qi::eps;
using qi::lit;
using qi::lexeme;
using qi::alpha;
ident %= lexeme[+alpha];
fnParams =
(eps(_r1 == "mag") >> double_) [makeMag(_val, _1)]
| (eps(_r1 == "sqrt") >> double_) [makeSqrt(_val, _1)]
| (eps(_r1 == "time") >> int_) [makeTime(_val, _1)]
;
fn = ident [_a = _1]
> lit('(')
> fnParams(_a) [_val = _1]
> lit(')');
ident.name("identifier");
fnParams.name("function parameters");
fn.name("function");
}
qi::rule<Iterator, qi::locals<std::string>, ascii::space_type, Fn()> fn;
qi::rule<Iterator, ascii::space_type, Fn(std::string)> fnParams;
qi::rule<Iterator, ascii::space_type, std::string()> ident;
};
int main() {
using Iter = std::string::const_iterator;
using boost::spirit::ascii::space;
FnParser <Iter> parser;
std::string str;
while (std::getline(std::cin, str)) {
if (str.empty() || str[0] == 'q' || str[0] == 'Q')
break;
Iter iter = str.begin();
Iter end = str.end();
Fn fn;
try {
bool r = phrase_parse(iter, end, parser, space, fn);
if (r && iter == end) {
std::cout << "Ok\n";
} else {
std::string rest(iter, end);
std::cout << "Failed\n"
<< "Stopped at \"" << rest << "\"\n";
}
} catch(qi::expectation_failure<Iter> e) {
std::string got(e.first, e.last);
std::cout << "Expected " << e.what_ << "\n"
<< "Got " << std::string(e.first, e.last) << "\n";
}
}
}
编辑
我没有给出完整的语法,因此可能缺少一些上下文。除了函数调用,完整的文法还有算术运算符和变量。区分函数调用和变量的唯一方法是之后出现左括号。两者都可以在相同的上下文中使用,我使用有序的替代方案fn | var
来优先考虑函数调用。这就是为什么我把期望点放在括号之后,而不是之前。
解决方案
您已经控制了预期失败的位置。
在例如
mag %= (lit("mag") >> lit('(') > double_ > lit(')'));
期望点是> double_
。要将其移动到参数列表的开头,请说:
mag %= lit("mag") > (lit('(') >> double_ > lit(')'));
顺便说一句,你可以这样写:
mag = "mag" > ('(' >> double_ >> ')'));
另外,我不明白为什么我的expectation_failure 在这种情况下指向“12)”而不仅仅是“12”。
我认为它只是打印到输入序列的末尾。在输入迭代器 ( ) 的情况下,它可能会打印到输入的最后一部分qi::istream_iterator
,但这是猜测。
作为旁注,您可以使用on_error
此处记录的更多控制权:https ://www.boost.org/doc/libs/1_67_0/libs/spirit/doc/html/spirit/qi/tutorials/mini_xml___error_handling.html和在编译器示例中。
更新
到编辑
区分函数调用和变量的唯一方法是之后出现左括号。两者都可以在相同的上下文中使用,我使用有序的替代 fn | var 优先考虑函数调用。这就是为什么我把期望点放在括号之后,而不是之前。
你仍然可以拥有它:
mag = "mag" >> &lit('(') > ('(' >> double_ >> ')'));
这使用先行&lit('(')
进入分支,然后从期望点开始。因此, no'('
只是不匹配,但期望点仍然在参数列表中“触发”。
其他想法
你说:
区分函数调用和变量的唯一方法是之后出现左括号
这当然取决于您对符号表和语义分析的选择。请参阅这些示例,其中我确实动态地进行了功能检测:
有点远相关:
推荐阅读
- flutter - 在相机应用程序中添加矩形覆盖并在颤动中裁剪肖像图像
- json - 使用高阶函数从帐户中提取联系人
- spring-boot - SecurityConfig 中出现 SpringSecurity + AWS Cognito 连接错误
- c# - 单击一个 Windows 弹出窗口
- regex - Powershell - 如何根据各种字符和 10 位数字拆分字符串?
- python - 如何在 Python 中仅返回选定的 API 参数
- python - 记录器对象不继承根级别
- javascript - 如何将本地存储称为空?
- amazon-web-services - AWS Amplify:两个独立应用程序上的相同管理员查询
- vb.net - 在 Aspose.Pdf 中,为什么给 Text 对象一个边框实际上给了它两个边框?如何摆脱内边框?