r - 贬低一个数据集,我发现了两种导致不同结果的不同方式
问题描述
我有以下数据集,我找到了两种贬低它的方法。
library(plm)
library(dplyr)
data("EmplUK", package="plm")
EmplUK <- EmplUK %>%
group_by(firm, year) %>%
mutate(Vote = sample(c(0,1),1) ,
Vote_won = ifelse(Vote==1, sample(c(0,1),1),0))
# EDIT:
EmplUK <- pdata.frame(EmplUK , index=c("firm", "year"), drop.index = FALSE)
# A tibble: 1,031 x 9
# Groups: firm, year [1,031]
firm year sector emp wage capital output Vote Vote_won
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1 1977 7 5.04 13.2 0.589 95.7 1 0
2 1 1978 7 5.60 12.3 0.632 97.4 0 0
3 1 1979 7 5.01 12.8 0.677 99.6 1 1
4 1 1980 7 4.72 13.8 0.617 101. 1 1
5 1 1981 7 4.09 14.3 0.508 99.6 0 0
6 1 1982 7 3.17 14.9 0.423 98.6 0 0
7 1 1983 7 2.94 13.8 0.392 100. 0 0
8 2 1977 7 71.3 14.8 16.9 95.7 1 0
9 2 1978 7 70.6 14.1 17.2 97.4 1 1
10 2 1979 7 70.9 15.0 17.5 99.6 1 1
这一次听到(DaveArmstrong 的回答):可视化面板数据中两个变量之间的关系:
demeaned_data <- EmplUK %>%
group_by(firm) %>%
mutate(across(c(output, wage), function(x)x-mean(x)))
而这个听到:Demean R data frame
library(plyr)
demean <- colwise(function(x) if(is.numeric(x)) x - mean(x) else x)
demeaned_data.2 <- ddply(EmplUK, .(firm), demean)
然而,查看直方图,结果却大不相同,一个显示差异,另一个显示平均值减去差异或什么?是一样的吗?:
hist(demeaned_data$wage, 100)
hist(demeaned_data.2$wage, 100)
解决方案
推荐阅读
- html - 包含其他 div 的 div 上的 svg 剪辑路径(无 css:clip-path)
- java - 从列表或两个不同实体中动态查询
- go - 在 Go 中清除缓冲区
- css - 当您使卡片可点击时,如何删除引导卡片中文本上的文本装饰(下划线)?
- android - Robolectric AndroidX 片段 NoClassDefFoundError
- node.js - 试图理解 npm 审计结果
- c# - 时间跨度比较
- java - 用java编写一个程序来检查给定字符串中是否存在子字符串而不使用数组
- mysql - MYSQL LEFT JOIN 未显示所有数据
- c++ - 在截断过程中乘以 2 个数字的问题