首页 > 解决方案 > 如何将男性和女性的人口加在一起以删除人口统计表中的性别作为变量。在 R 工作室中

问题描述

这是我第一次发布问题,所以可能没有正确的信息开始,提前道歉。我是 R 新手。更喜欢使用 dplyr 或 tidyverse,因为这些是我们迄今为止使用的软件包。我确实搜索了一个类似的问题,但大多数与性别/性别相关的问题都是关于分离数据,或者分别对每个数据执行操作。

我有一张人口计数表,其中包含变量(因素)年龄范围、年份和性别,人口作为因变量。我想创建一个图表来显示人口是否正在老龄化 - 即显示不同年龄组的相对比例如何随时间变化。但是性别无关紧要,所以我想将每个年份和年龄范围的男性和女性的人口数量加在一起。

我不知道如何提供原始数据 .csv 文件的副本,所以如果您有任何建议,请告诉我。

这是数据示例(输出表): 输出表

这是到目前为止的代码:

 file_name <- "AusPopDemographics.csv"
AusDemo_df = read.table(file_name,",", header=TRUE)

(grp_AusDemo_df <- AusDemo_df %>% group_by(Year, Age))

我猜可能类似于 pivot(wider) 将男性和女性作为列标题,然后 transmute() 对它们求和并创建一个新的人口列。

谢谢你的帮助。

标签: rpivotdemographics

解决方案


dplyr可以做这样的事情

library(dplyr)
grp_AusDemo_df <- AusDemo_df %>% 
  group_by(Year, Age) %>%
  summarise(Population = sum(Population, na.rm = TRUE)) 

推荐阅读