首页 > 解决方案 > 如何使用 grep 查找 html 标签的值

问题描述

我想分析我的网页的某些方面。例如,我想查看所有alt标签的值。对于示例,我创建了包含少量alt标签的简单 html 代码。假设代码中的标签是:

alt='Text-01'
alt='Text 02'
alt=''
alt='Some long text'

然后我尝试了命令:

grep -o "alt='*'" my-page.html

输出是:

alt='
alt='
alt=''
alt='

我期待看到这样的输出:

Text-01
Text 02
empty line or alt=''
Some long text

或者这个:

alt='Text-01'
alt='Text 02'
alt=''
alt='Some long text'

你能帮我实现吗?

标签: htmlgrephtml-parsing

解决方案


如果您确定知道alt的参数 在单引号之间,您可以执行

grep -o "alt='[^']*'" file

这将搜索alt=,后跟一个单引号,然后是任意数量的非单引号,最后是一个终止单引号。


推荐阅读