首页 > 解决方案 > 如何在 sed 可能多次出现的两个标记模式之间选择数据?

问题描述

如何在 sed 可能多次出现的两个标记模式之间选择数据?

我在这里阅读了一些相关的线程,包括这个但我仍然对 sed 的复杂参数感到困惑。

我的数据是一些网页源代码,它们一团糟,没有断线。

例如:

123<div>abc</div><span>DEF</span><div>ghi</div>456

我需要得到如下输出,从第一个<div>到最后一个</div>,我怎样才能用 sed 做到这一点?:

<div>abc</div><span>DEF</span><div>ghi</div>

第二个问题:根据上面的结果,如何获取数据<span>DEF</span>

非常感谢:)

标签: sed

解决方案


对于您提供的特定示例,这是正则表达式:

<div>.*<\/div>

在这里测试一下。


推荐阅读