首页 > 解决方案 > 删除目录中所有 txt 文件低于阈值的行

问题描述

我有 800 个 XY 格式的 txt 文件,其中 X 和 Y 都是数字。我需要 (1) 删除每个 txt 文件 x<91 的数据行,然后 (2) 根据原始文件名写入新的 txt 文件。

我成功地制作了一个 tidyverse 代码,逐个文件执行此文件,这比手动通过记事本并删除有问题的数据行要慢。我很难让代码循环遍历目录中的所有文件。

这是迷你代码:

oldfile<- read_tsv(file='WD130887.txt',col_names=FALSE)
newfile<- filter(oldfile, X1>91)
write_tsv(newfile,path ='E:/Contract Data/Shorea2/edited/WD130887.txt')

它完全按照应有的方式工作。它将我新编辑的文件放在一个新目录中,这样就不会覆盖任何内容。输出:

> write_tsv(newfile,path ='E:/Contract Data/Shorea2/edited/Shorea sp_WD130887.txt')
> oldfile<- read_tsv(file='Shorea sp_WD130887.txt',col_names=FALSE)
Parsed with column specification:
cols(
  X1 = col_double(),
  X2 = col_double()
)
> head(oldfile,n=5)
# A tibble: 5 x 2
     X1     X2
  <dbl>  <dbl>
1  89.0  1502.
2  89.1  5791.
3  90.1 20390.
4  91.1   760.
5  93.0 11748.
> newfile<- filter(oldfile, X1>91)
> head(newfile,n=5)
# A tibble: 5 x 2
     X1     X2
  <dbl>  <dbl>
1  91.1   760.
2  93.0 11748.
3  94.1  5183.
4  95.0  4021.
5  95.1   864.
> write_tsv(newfile,path ='E:/Contract Data/Shorea2/edited/Shorea sp_WD130887.txt')

我尝试对整个目录执行此操作使我来到这里:

path <- "E:/Contract Data/Shorea2"
fs <-list.files(path, pattern=glob2rx("*.txt$")) #create list of my txt files
for (f in fs){
  fname <- file.path(path, f)
  df <- read_tsv(fname,col_names=FALSE) #open each txt file
  df <- filter(fname,X1>91) #apply tidyverse filter
  write_tsv(df, fname, row.names=FALSE) #write new txt file, I gave up on new directory
}

但我收到错误消息:

Error in UseMethod("filter_") : 
  no applicable method for 'filter_' applied to an object of class "character"

我相信这意味着代码现在正在查看文件名而不是行的值。帮助表示赞赏!我确信这是一个简单的问题,我错过了一些明显的东西。

标签: rbatch-processingdelete-row

解决方案


推荐阅读