首页 > 解决方案 > 润滑周期的绝对值

问题描述

我正在尝试使用 lubridate 确定两个日期之间的绝对天数。

library(lubridate)

dates <- data.frame(
  time1 = date(c("2011-01-01", "2012-01-01", "2013-01-01")),
  time2 = date(c("2011-01-02", "2011-12-31", "2013-01-01"))
)

dates$diff <- days(dates$time1 - dates$time2)
dates$diff
[1] "-1d 0H 0M 0S" "1d 0H 0M 0S"  "0S" 
abs(dates$diff)
[1] "-1d 0H 0M 0S" "1d 0H 0M 0S"  "0S" 

我本来希望所有的价值观都是积极的。此外,min不要max返回最小值和最大值。

min(dates$diff)
[1] 0
max(dates$diff)
[1] 0

为什么这些函数在lubridate句点上的行为与在数字/整数对象上的行为不同?

标签: rdatelubridate

解决方案


简单的答案是period来自 lubridate 的类对象不是简单的数字对象。它们是 S4 对象。它们的主要数据成员是seconds的数字向量,分钟、小时、天和年都存储为属性。当您尝试对period对象应用数学运算符时,运算符不适用于属性,仅适用于主要数值向量,即秒部分。

如果我们创建一个period-1 秒,我们可以看到这一点:

library(lubridate)

p <- as.period(diff(as.POSIXct(c("2020-09-24 21:00:01", "2020-09-24 21:00:00"))))

p
#> [1] "-1S"

abs(p)
#> [1] "1S"

现在让我们检查对象的属性:

attributes(p)
#> $year
#> [1] 0
#> 
#> $month
#> [1] 0
#> 
#> $day
#> [1] 0
#> 
#> $hour
#> [1] 0
#> 
#> $minute
#> [1] 0
#> 
#> $class
#> [1] "Period"
#> attr(,"package")
#> [1] "lubridate"

对于 S4 对象,您需要通过编写“Math”和“Summary”组泛型来定义函数喜欢abs和将要执行的操作。min然而,这些还没有为类“周期”定义,所以它们被调用在主数据向量(这只是秒向量)上。但是,Ops组泛型被定义,这就是为什么您可以做类似的事情dates$diff / 2并获得明智的答案。

为什么它们没有被定义?这是作者要回答的问题。同时,您可以通过制作absS3 方法并专门编写abs.period方法来获得所需的功能,如下所示:

abs         <- function(x) UseMethod("abs")
abs.default <- function(x) base::abs(x)
abs.Period  <- function(out) 
{
   new("Period", abs(out$second), 
       year = abs(out$year), 
       month = abs(out$month), 
       day = abs(out$day), hour = abs(out$hour), 
       minute = abs(out$minute))
}

这会给你预期的行为:

dates <- data.frame(
  time1 = date(c("2011-01-01", "2012-01-01", "2013-01-01")),
  time2 = date(c("2011-01-02", "2011-12-31", "2013-01-01"))
)

dates$diff <- days(dates$time1 - dates$time2)

abs(dates$diff)
#> [1] "1d 0H 0M 0S" "1d 0H 0M 0S" "0S"

然而,这可能不是一个好主意。最好使用 difftimes 进行算术运算,并在需要时转换为句点。

我希望这能澄清一点。


推荐阅读