r - 选择多个日期列并将因子变量转换为日期
问题描述
我有一个 data.frame,其中包含多个包含日期的列。目前它们被认为是“因子”类。我想选择所有应该是日期的列(其中有 10 个,它们的名称中都有“日期”,例如 Date_Construc、Date_use、Comp_date ...)并将它们从 factor 转换为 date。
这是我尝试过的:首先我想选择向量中的相关列
library(tidyselect)
date_vars <- vars_select(names(df1), contains("Date", ignore.case = TRUE))
然后
library(lubridate)
date_vars <- dmy(date_vars)
也试过
date_vars <- vars_select(names(df1), contains("Date", ignore.case = TRUE))
df1[date_vars] <- lapply(df1[date_vars], as.Date)
我明白了
Error in as.Date.numeric(X[[i]], ...) : 'origin' must be supplied
还
date_vars <- vars_select(names(df1), contains("Date", ignore.case = TRUE))
df1[date_vars] <- dmy(as.character(df1[date_vars])
结果,
Warning message:
All formats failed to parse. No formats found.
这是当前格式的示例数据:
Date_Construct= c("10/03/2018 00:00", "21/03/2015 00:00", "20/02/2012 00:00")
Date_use = c("02/08/2007 00:00", "31/10/2007 00:00", "13/08/2008 00:00")
ID = c("0001", "34560", "100041531")
Comp = c("Revis", "Succ", "Revis")
dfq= data.frame(`ID`, `Date_Construct`, `Date_use`, `Comp`)
ID Date_Construct Date_use Comp
1 0001 10/03/2018 00:00 02/08/2007 00:00 Revis
2 34560 21/03/2015 00:00 31/10/2007 00:00 Succ
3 100041531 20/02/2012 00:00 13/08/2008 00:00 Revis
解决方案
根据提供的新数据更新答案。
试试下面的。无需去除日期时间字符串的时间部分。您可以使用lubridate
与数据匹配的函数(在本例中为dmy_hm()
)对其进行解析,然后忽略它。
dfq_parsed <- dfq %>%
mutate(across(contains("date", ignore.case = TRUE), dmy_hm))
这产生:
ID Date_Construct Date_use Comp
1 0001 2018-03-10 2007-08-02 Revis
2 34560 2015-03-21 2007-10-31 Succ
3 100041531 2012-02-20 2008-08-13 Revis
日期与 POSIXct 相同,但这很容易使用:
'data.frame': 3 obs. of 4 variables:
$ ID : chr "0001" "34560" "100041531"
$ Date_Construct: POSIXct, format: "2018-03-10" "2015-03-21" "2012-02-20"
$ Date_use : POSIXct, format: "2007-08-02" "2007-10-31" "2008-08-13"
$ Comp : chr "Revis" "Succ" "Revis"
推荐阅读
- sql - 如何在 postgres 中在其中一列的值为“true”的两列上添加唯一约束
- scikit-learn - 如何预测离群值比例的最佳值?
- ios - 在两个 iPhone 应用程序 iOS 之间共享数据
- crystal-reports - 在 Crystal 中,如何计算订单中的每个订单项而不是每个数量?
- javascript - 角度 6 依赖注入
- java - 无法在 Spring JPA 中创建 INNER JOIN 查询
- spring-mvc - 在使用 Websphere 环境的 Spring 框架中出现错误 java.lang.NoClassDefFoundError: org.springframework.web.servlet.ModelAndView
- architecture - Kubernetes 自动缩放速度不够快
- r - 根据每个元素的平方和排列向量列表
- routes - 所有 api 操作的一条路线