首页 > 解决方案 > 读取批量 CSV 和过滤以摆脱标题不起作用

问题描述

我正在使用包 read_bulk 读取大量 CSV 文件。

  dfc <- data.frame(read_bulk(directory = "C:/place/with/data", 
            subdirectories = FALSE, 
            extension = ".csv",
            data = NULL,
            verbose = TRUE, 
            fun = utils::read.csv, stringsAsFactors = FALSE, is.na(" ")))

  names(dfc) <- c("Headers", "I", "Want", "Instead")

  write_csv(dfc, path = paste("Data"," ",Sys.Date(),".csv"))

效果很好,但我希望删除标题。headers = FALSE 在 read_bulk 中不起作用。我认为这将是一个简单的修复

  dfc %>%
     filter(Headers != "undesirable headers from read_bulk") 

在我分配名称之后,但这并没有奏效。我还尝试了 str_extract_all 的“来自 read_bulk 的不受欢迎的标头”,但这也没有奏效。

所有数据的str都是字符,尽管所有数据的第一列标题在read_bulk之后的列名之前都有。这是编码问题吗?这会导致我的数据不被过滤吗?

虚拟数据

  CSV Dataset 1           CSV Dataset2              ...etc more datasets

  Facility ID Status      Facility ID Status
  abc      1  A           def      5  A
  efg      2  B           lmo      8  B
  hij      3  A           pqr      9  C
  abc      4  B           xyz      7  B

读取大量虚拟数据后的 R 输出

  Facility ID Status
  abc            1  A
  efg            2  B
  hij            3  A
  abc            4  B
  Facility ID Status
  def            5  A
  lmo            8  B
  pqr            9  C
  xyz            7  B

我想从我的数据集中删除这些标题

标签: rcsv

解决方案


推荐阅读