首页 > 解决方案 > R 从标准 UTC 时区更改为多个本地时区

问题描述

假设我有一个 df,其中包含对调查的一系列回复。每个响应都有一个 UTC 时间戳。我也恰好有填写调查表的每个人的当地时区。

例如:

 df <-  data.frame(day = c("2018-12-06 15:40:29", "2018-12-06 15:25:28", 
"2018-12-06 15:25:28", "2018-12-06 14:09:09"), time_zone = c("EST", "PST", "CST", "EST"))

df$day <- as.POSIXct(df$day, tz = "UTC")

对于参加调查的人,我希望所有这些日期都反映当地的时间。所以我尝试了以下方法:

df %>% 
  mutate(time_start = format(day, tz = time_zone))

但我明白了 Error in mutate_impl(.data, dots) : Evaluation error: invalid 'tz' value.

我还尝试使用具有 GTM 格式时区的数据框

df<-  data.frame(day = c("2018-12-06 15:40:29", "2018-12-06 15:25:28", 
"2018-12-06 15:25:28", "2018-12-06 14:09:09"), 
time_zone = c("GMT-5", "GMT-6", "GMT-7", "GMT-8"))

有没有办法将一系列标准化时间更改为当地时间?

标签: rdatetimetimezoneposixct

解决方案


这里有多个问题:

  1. format(和其他与时间相关的函数)只接受一个长度为 1 的参数tz
  2. R 识别的时区不包括流行"CST"的 ,"PST"等。

要解决第一个问题,使用Mapormapply就足够了。

不幸的是,第二个需要更多的研究。诸如此类的区域"PST",尽管至少在美国(如果不是其他国家)很流行,但不是有效的时区字符串(参考:CCTZ,一个用于在时区之间转换的 C++ 库,如是说)。等都不是"GMT-7",尽管后者可以通过在前面加上Etc/来伪造,如:"Etc/GMT-7"。或者,您可以选择"America/New_York"or的替代品"US/Eastern"

df$time_zone <- c("US/Eastern", "US/Pacific", "US/Central", "US/Eastern")
df
#                   day  time_zone
# 1 2018-12-06 15:40:29 US/Eastern
# 2 2018-12-06 15:25:28 US/Pacific
# 3 2018-12-06 15:25:28 US/Central
# 4 2018-12-06 14:09:09 US/Eastern
mapply(format, df$day, tz = "GMT")
# [1] "2018-12-06 15:40:29" "2018-12-06 15:25:28" "2018-12-06 15:25:28"
# [4] "2018-12-06 14:09:09"
mapply(format, df$day, tz = df$time_zone)
# [1] "2018-12-06 10:40:29" "2018-12-06 07:25:28" "2018-12-06 09:25:28"
# [4] "2018-12-06 09:09:09"

R 时区的所有可立即识别的格式都可以在 594 元素向量中找到:

str(OlsonNames())
#  chr [1:592] "Africa/Abidjan" "Africa/Accra" "Africa/Addis_Ababa" ...
#  - attr(*, "Version")= chr "2018e"
set.seed(2)
sample(OlsonNames(), size=8)
# [1] "America/El_Salvador"  "Etc/GMT+8"            "Atlantic/Madeira"    
# [4] "America/Creston"      "Pacific/Port_Moresby" "Pacific/Ponape"      
# [7] "America/Atka"         "GB-Eire"             
grep("US/", OlsonNames(), value = TRUE)
#  [1] "US/Alaska"         "US/Aleutian"       "US/Arizona"       
#  [4] "US/Central"        "US/East-Indiana"   "US/Eastern"       
#  [7] "US/Hawaii"         "US/Indiana-Starke" "US/Michigan"      
# [10] "US/Mountain"       "US/Pacific"        "US/Pacific-New"   
# [13] "US/Samoa"         

在此示例中,您将看到可以使用的替代方法之一:"Etc/GMT+8". 注意它在本初子午线+西边,所以

mapply(format, df$day, tz = "US/Eastern")
# [1] "2018-12-06 10:40:29" "2018-12-06 10:25:28" "2018-12-06 10:25:28"
# [4] "2018-12-06 09:09:09"
mapply(format, df$day, tz = "Etc/GMT+5")
# [1] "2018-12-06 10:40:29" "2018-12-06 10:25:28" "2018-12-06 10:25:28"
# [4] "2018-12-06 09:09:09"

警告购买者:"US/Eastern"在适当的情况下使用应考虑夏令时;"Etc/GMT+5"不,我相信。


推荐阅读