parsing - 如何使用 Parsec 制作子解析器?
问题描述
我想解析几个缩进或格式化为数组的命令列表Parsec
。例如,我的列表格式如下:
Command1 arg1 arg2 Command1 arg1 arg2 Command1 arg1 arg2
Command2 arg1 Command3 arg1 arg2 arg3
Command3 arg1 arg2 arg3
Command4
Command3 arg1 arg2 arg3 Command2 arg1
Command4
Command4
Command5 arg1 Command2 arg1
这些命令应该通过解析器中的状态更改逐列解析。
我的想法是将命令收集到单独的字符串列表中,并将这些字符串解析为子解析器(在主解析器内执行)。
我检查了 Parsec 库的 API,但没有找到执行此操作的函数。
我考虑过使用runParser
,但这个函数只提取解析器的结果,而不是它的状态。
我还考虑制作一个受启发的函数runParsecT
并mkPT
制作我自己的解析器,但构造函数ParsecT
或initialPos
不可用(不由库导出)
是否可以在解析器中运行子解析器Parsec
?
如果没有,像megaparsec这样的库可以解决我的问题吗?
解决方案
不是一个完整的答案,更多的是一个需要澄清的问题:
是否有必要建立一个字符串列表?我更愿意解析输入并将其转换为更特殊的数据类型。这样你就可以使用haskell的类型保证。
我将首先为我的命令定义一个数据类型:
data Command = Command1 Argtype1
| Command2 Argtype2
| Command3 Argtype1 Argtype2
data Argtype1 = Arg1 | Arg2 | ArgX
data Argtype2 = Arg2_1 | Arg2_2
之后,您可以解析输入并将其放入数据类型中。
在解析结束时,您可以获得mappend
结果(即在前面添加带有操作 (:) 的列表)。
您最终会得到 [Command] 的数据类型。有了它,您可以进一步工作。
要解析文本,您可以按照 ( https://markkarpov.com/megaparsec/parsing-simple-imperative-language.html )上的包 megaparsec 的介绍进行操作
或者你的意思是完全不同的东西?也许每一行(包含一些命令)作为一个整体应该是状态机的一个输入,并且状态机相对于命令而变化?然后我想知道为什么状态机要实现为解析器。
推荐阅读
- python - 在 for 循环的第二步中在参数上存储值时出错
- flutter - 如何在颤振飞镖中访问提供者中的吸气剂
- java - 未知错误:未处理的检查器错误:{"code":-32000,"message":"Cannot find context with specified id"}
- android - 试图在手机上安装 app_debug.apk 并没有安装应用程序
- python - Python - while循环,调用变量
- python - 使用 Selenium-webdriver for python 自动阻止 Chrome 请求?
- python - 应用 A* 路径 3:3D 坐标对 -- Python ValueError: 升序长度 (2) != 长度为 (3)
- c - 复制char数组并排序
- node.js - 对于非本地、非生产环境的 NodeJS 项目,nwrl nx 环境文件不会被替换
- sql - 为键为 GUID 的 json 应用 JSON_VALUE