string - 提取两个值之间的特定单词
问题描述
我将一个 html 页面和股票输出卷曲到变量中,所以我尝试在两个值之间提取一个单词,但我失败了。
</tr> <tr> <td><a <a href="https://test/one/AAA">AAA</a></td>
<td>Thu Aug 30 09:59:36 UTC 2018</td> <td align="right"> 2247366 </td>
<td></td> </tr> <tr> <td><a
href="https://test/one/1.1.22">1.1.22</a></td> <td>Thu Aug 30 09:59:36
UTC 2018</td> <td align="right"> 5 </td> <td></td> </tr> </table>
</body> </html>
content=$(curl -s https://test/one/)
echo $content | sed -E 's_.*one/([^"]+).*_\1_'
我试图在一个/之后和之前捕捉价值,所以我想提取AAA,1.1.22,......
解决方案
$ ... | sed -E 's_.*one/([^"]+).*_\1_'
AAA
BBB
由于您的内容中有斜线,因此最好选择不同的分隔符,我在这里使用_
.
更新 由于您极大地更改了输入文件格式,因此这是更新的脚本
$ echo "$contents" | sed -nE '/one/s_.*one/([^"]+).*_\1_p'
AAA
1.1.22
推荐阅读
- postgresql - Ecto.Adapters.SQL.query!给出不同的结果
- r - 如何使用 htmltools 创建自适应列表 (ul+li)?
- vb.net - Option Strict On 禁止从 'String' 到 'Char' VB.NET 的隐式转换
- oracle - 保存在表格中的最后一条记录超过一列
- angular - Angular 8 - Chartist - 不在表格中加载图表
- sql - 查询获取祖父母和孙子
- pycharm - AttributeError:部分初始化的模块“boto3”没有属性“资源”(很可能是由于循环导入)
- excel - 如何禁用或限制拆分工作表窗格中的滚动
- google-app-engine - 在 Google App Engine 上安装 Torch 时遇到问题
- css - 当同一容器中的另一个 div 具有未定义的高度时,设置容器内 div 的大小