首页 > 解决方案 > datamash:处理列中的空值

问题描述

datamash用来评估价格数据列。在浏览man页面时,我没有看到任何明确的路径来处理以下内容。

The Viridian convict / by York, Sam,    YORK    B       F       15.00   15.00
Show me a mountain / by Young, Kerry,   YOUNG   B       F       27.00   27.00
Eve / by Young, William P.      YOUNG   B       F       27.00   27.00
The gates of Evangeline / by Young, Hester.     YOUNG   B       F       26.00   26.00
Meddling and murder / by Yu, Ovidia,    YU      B       F       
Vision of the future / by Zahn, Timothy.        ZAHN    B       F       8.00    8.00
Star wars. by Zahn, Timothy,    ZAHN    B       F       
Wicked bite / by Zanetti, Rebecca,      ZANETTI B       F       15.00   15.00

请注意 2 列中的缺失值。我还没有找到一种方法来datamash处理缺失值而不使用其他工具进行预处理。

前任。

awk -F'\t' '$6 != "" {print $6}' print.csv | datamash mean 1 sstdev 1 median 1

--narm选项似乎很有希望,但根本没有帮助。我得到以下信息:

datamash:第 1 行字段 6 中的无效数值:''

如果需要的话,我可以继续使用管道,但我是这个工具的新手,我怀疑有一种更简单的方法。

标签: bashstatistics

解决方案


推荐阅读