r - 通过基于列的计算过滤R中的数据框
问题描述
我有一个包含多个列的数据框,其中两个是日期。从一个日期列,我想计算从那个(日期 - 14)到今天的所有星期日。然后,我想过滤其他日期列等于这些日期的数据。下面是一个例子:(原始数据比这个大得多)
ex_data <- data.frame(
c("2018-05-27", "2018-06-24", "2018-07-01", "2018-07-08", "2018-06-25",
"2018-07-05", "2018-07-10", "2018-05-30", "2018-06-20", "2018-07-04",
"2017-12-05"),
c("2018-05-13", "2018-02-04", "2018-06-17", "2018-06-10", "2018-04-04",
"2018-01-14", "2018-06-17", "2018-06-24", "2018-07-01", "2017-12-03",
"2018-06-17"),
c(rep("1", 4), rep("2", 3), rep("3", 2), rep("1", 1),5),
c(rep("xxx", 4), rep("yyyy", 3), rep("zz", 2), rep("xxx", 1),"ttt"))
colnames(ex_data) <- c("Date1", "Date2", "Ex1", "Ex2")
我想找到从 Date1 到今天两周的星期日(我们称之为“previousSundays”)。每行的结果是从 date1 的对应值到今天的星期几的列表/向量。例如,对于第一行,它将是:
"2018-05-13" "2018-05-20" "2018-05-27" "2018-06-03" "2018-06-10"
"2018-06-17" "2018-06-24" "2018-07-01" "2018-07-08" "2018-07-15"
"2018-07-22" "2018-07-29"
然后我想过滤我的数据框,以便我只有 Date2 等于“previousSundays”的值。
所需的输出如下所示:(仅对前三行一一计算)
Date1 Date2 Ex1 Ex2
2018-05-27 2018-05-13 1 xxx
2018-07-01 2018-06-17 1 xxx
任何想法在 R 中最好的方法是什么?我使用lapply
和seq
功能,但它没有工作。以下是我尝试做的事情:
ex_data$prevdays <- lapply(ex_data$Date1 - 14, seq, var2 = Sys.Date(), by = "week")
(以及上述行的一些变体)
我已经搜索了网站/互联网,但找不到解决我问题的解决方案。感谢任何建议,因为我找不到解决此问题的优雅方法。
解决方案
看来您可以通过设置一系列条件来做到这一点。
# first recode the dates
ex_data[, 1:2] <- lapply(ex_data[, 1:2], as.Date)
# check if date is a sunday
is.sunday <- format(ex_data$Date2, "%u") == 7
today <- Sys.Date()
# slightly more tricky. Aggregate Date1 over Ex2 and find the minima
mins <- aggregate(Date1 ~ Ex2, data=ex_data, min)
# use the result as a lookup-table
mins <- mins$Date1[match(ex_data$Ex2, mins$Ex2)]
# combine (create the intersect of) the conditions
matches <- ex_data$Date2 > mins - 14 & ex_data$Date2 < today & is.sunday
# and filter the data
ex_data[matches,]
# Date1 Date2 Ex1 Ex2
# 3 2018-07-01 2018-06-17 1 xxx
# 4 2018-07-08 2018-06-10 1 xxx
# 7 2018-07-10 2018-06-17 2 yyyy
# 8 2018-05-30 2018-06-24 3 zz
# 9 2018-06-20 2018-07-01 3 zz
# 11 2017-12-05 2018-06-17 5 ttt
推荐阅读
- r - 如何使用 ggplot2 重新排序 geom_boxplot() 中显示的单元组?
- angular - 角度材料表中屏幕尺寸减小时如何支持相同的列尺寸
- r - 宽格式导致 ggplot 中的条形图数据加倍
- javascript - 在对象中声明异步函数/承诺
- python - 如何使 Tkinter 中的 GUI 可扩展
- wordpress - 如何重定向到主页
- angular - 后端 API 成功完成但 NG 没有收到任何内容
- json - 带有 json 的 Discordjs Web 仪表板
- asp.net - 添加了对现有 HttpContext 用户的声明
- reactjs - 从动态生成的反应组件将背景和字体颜色保存到本地存储