首页 > 解决方案 > 使用 data.table::fread 读取压缩文件时测试行

问题描述

我正在编写一个函数来解析特定于软件的输出(bismark stranded_CpG_report):

21      13      +       0       0       CG      CGA
21      14      -       0       0       CG      CGA
21      100     +       0       0       CG      CGT
21      101     -       0       1       CG      CGC
21      150     +       2       0       CG      CGG

因为这些文件很大,我需要过滤掉0第 4 列和第 5 列中的行。

现在我知道如何实现它的唯一方法是调用 shell 命令:

fread(cmd=paste("zcat -f ", "path/to/file.tsv" ," | awk '$4 || $5'"), stringsAsFactors=FALSE)

我有两个问题:

谢谢你的帮助

标签: rdata.tablebioinformaticsfread

解决方案


推荐阅读