r - 棒球运动员的薪水和联赛
问题描述
我正在学习 R,我正在使用 Lahman 数据集来确定球员的薪水是否会影响他们或他们的球队的比赛方式。当我深入研究数据时,我很想知道一个球员的薪水是否会因他参加的联赛(AL 或 NL)而有所不同。我写了这个程序来看看它们是否依赖......我很惊讶地发现它们是。这就是我要回答这个问题的方式吗?
library(tidyverse)
library(Lahman)
#Brings salary information together with batting
bat_salaries <- left_join(Batting,Salaries, suffix = c(".x", ".y"))
bat_salaries <- left_join(bat_salaries, Teams, by = c("yearID", "teamID", "lgID"), suffix = c("_individual", "_team"))
#I noticed the tail of bat_salaries$salary is very heavy after the 3rd IQR - I cut it off to only look at
#data before the 3rd IQR
bat_salaries_iqr3 <- bat_salaries %>%
filter(salary < 2350000 & salary > 0)
bat_salaries_chi <- bat_salaries_iqr3 %>%
select(salary) %>%
mutate(leagID = ifelse(bat_salaries_iqr3$lgID == "NL", 1, 0))
chisq.test(table(bat_salaries_chi), correct = FALSE)
Pearson's Chi-squared test
data: table(bat_salaries_chi)
X-squared = 2462.6, df = 2139, p-value = 1.13e-06
解决方案
推荐阅读
- c - 从文件的 inode 号获取文件名
- dashboard - 如何将现有仪表板复制到 Appdynamics 中的新项目
- python - 在哪里可以找到内置类和 ABC 的 Python 类型提示?
- javascript - Web 组件中页面加载时的模式弹出窗口
- python-3.x - 语音识别库给出输入设备错误
- mysql - MySQL 显示“possible_keys”但不使用它
- php - Lumen count():参数必须是数组或者实现了Countable的对象
- html - 导航栏未扩展到页面的整个宽度
- unity3d - 如何统一制作基本的二维翻转时钟
- javascript - 单击按钮组时如何识别单击了哪个按钮