首页 > 解决方案 > R中tbl_spark中的多种日期格式。我想将所有日期格式更改为一种格式(dd-mm-yyyy)

问题描述

library(sparklyr)
sc <- spark_connect(master = "local")

date1 <- data.frame(DATE1 =c ("12-01-2020","2020-12-24",
  "14-May-2020","19/3/2020 14:32:15",
  "2020-09-08","05/05/2020"),
  NAME1 = c("A","B","C","D","E","F"))
tbl <- copy_to(sc, date1)

最终结果日期应采用“dd-mmm-yyyy”格式。

试过这个

 lubridate::parse_date_time(tbl %>% select(DATE1) , c('dmY', 'Ymd', 'dmYT'))

[1] NA NA 警告消息:所有格式都无法解析。未找到格式。

标签: rsparklyr

解决方案


这适用于R,你能检查它是否适用于sparklyr

as.Date(lubridate::parse_date_time(date1$DATE1, c('dmY', 'Ymd', 'dmYT')))
#[1] "2020-01-12" "2020-12-24" "2020-05-14" "2020-03-19" "2020-09-08" "2020-05-05"

推荐阅读