首页 > 解决方案 > 将管道分为 3 个不同的进程并匹配第二个匹配项

问题描述

我正在尝试创建一个 bash 脚本,该脚本向我显示德国和瑞士以及全世界的新冠病毒感染人数的最新统计数据。

corona () {
    curl -s https://corona-stats.online\?minimal\=true | tee >(head -n 1) > >(grep "(CH)\|(DE)")
    curl -s https://corona-stats.online\?minimal\=true | tail -n 20 | grep World
}

如您所见,为此我必须创建这个非常丑陋的脚本,其中 curl 被调用了两次。我必须这样做,因为网站看起来像这样:

Rank World                               Total Cases  New Cases ▲ Total Deaths New Deaths ▲ Recovered  Active    Critical Cases / 1M pop
1    USA (US)                               7,497,256     2,585 ▲      212,694         34 ▲  4,737,369 2,547,193   14,190         22,617
2    India (IN)                             6,397,896     5,936 ▲       99,833         29 ▲  5,352,078   945,985    8,944          4,625
3    Brazil (BR)                            4,849,229                  144,767               4,212,772   491,690    8,318         22,773
4    Russia (RU)                            1,194,643     9,412 ▲       21,077        186 ▲    970,296   203,270    2,300          8,185
...
22   Germany (DE)                             295,943       413 ▲        9,586                 259,500    26,857      362          3,529
...
58   Switzerland (CH)                          54,384       552 ▲        2,075          1 ▲     45,300     7,009       32          6,272
...
     World                                 34,534,040    63,822 ▲    1,028,540      1,395 ▲ 25,482,492 8,023,008   66,092       4,430.85


Code: https://github.com/sagarkarira/coronavirus-tracker-cli
Twitter: https://twitter.com/ekrysis

Last Updated on: 02-Oct-2020 12:10 UTC

US STATES API: https://corona-stats.online/states/us
HELP: https://corona-stats.online/help
SPONSORED BY: ZEIT NOW
Checkout fun new side project I am working on: https://messagink.com/story/5eefb79b77193090dd29d3ce/global-response-to-coronavirus

我只想显示表格(世界)的第一行、最后一行以及关于德国和瑞士的两行。我设法通过将 curl 的输出输入并 grep 国家代码来显示第一行以及两个国家/head -n 1地区。多亏了这个答案,我才能做到这两件事。

现在我想获取表格中的最后一行,即显示整个世界当前病例的那一行。我尝试再次使用 tee 将其通过管道传输到第三个进程中tee >(head -n 1) > >(grep "(CH)\|(DE)") > >(tail -n 20 | grep World)。但这没有用。我的第一个问题是,如何使用 tee 将输出传输到 3 个不同的进程中?

第二个问题围绕着我尝试 grep 世界线的方式。我尾随最后 20 行,然后 grep “World”。我这样做是因为如果我只是简单地 grep “World”,它只会返回也可以找到“World”的标题行。所以我的第二个问题是:我怎样才能只 grep 最后一次或第二次出现?

标签: linuxbashcurlgreptee

解决方案


您可以链接多个tee命令并仅丢弃 tee 的最后一个输出:

curl -s ... | tee >( cmd1 ) | tee >( cmd2 ) | tee > >( cmd3 )

实际上,我们可以将其缩短为:

curl -s ... | tee >( cmd1 ) | tee >( cmd2 ) | cmd3

因为无论如何我们都不使用最后一个的输出tee

将多个命令同时写入终端可能会使输出混淆。一个更优雅的解决方案是只使用一个 grep,例如

curl -s ... | grep '(DE)\|(CH)\|World.*,'

该表达式World.*,将仅在 之后的同一行中查找逗号,World以排除标题行。


推荐阅读