首页 > 解决方案 > 变量的平均值

问题描述

我一直试图找到一个变量的平均值,但是当我运行代码时它说:“最大对象的长度不是最小对象长度的倍数。”

以下是问题的陈述:“在经历过至少一次暗杀企图的国家中,平均暗杀企图(每年)是多少?

这是所需的数据集:leaders <- read.csv(" https://raw.githubusercontent.com/umbertomig/intro-prob-stat-FGV/master/datasets/leaders.csv ")

这是我使用的代码:

avrn$avrnbr <- as.numeric(leaders$result == "wounded lightly","dies within a day after the attack",
                          "dies between a day and a week", "dies between a week and a month",
                          "dies, timing unknown", "survives, whether wounded unknown",
                          "not wounded",
                          "plot stopped",
                          "hospitalization but no permanent disability",
                          leaders$year == 1878:2001)

我试图创建一个变量来衡量每年暗杀的平均值。

标签: rsummean

解决方案


该数据集包含有关特定国家领导人之间暗杀企图的信息。从 1878 年到 2001 年的 124 年间,共有 250 条记录。

你的问题:“在经历过至少一次暗杀企图的国家中,平均暗杀企图(每年)是多少?”

根据定义,该数据集中的每个国家都经历过至少 1 次暗杀企图。所以不需要子集或过滤。也没有必要像您所做的那样过滤年份。我们只需要计算暗杀企图的总数(250)除以跨越数据的年数(124)。答案:2。


好奇心战胜了我。哪些国家的领导人最不受欢迎?

library(dplyr)

count(leaders, country) %>% arrange(-n)

# A tibble: 88 x 2
   country           n
   <chr>         <int>
 1 Japan            11
 2 Mexico           11
 3 France           10
 4 Russia           10
 5 United States     8
 6 Guatemala         7
 7 Egypt             6
 8 Iran              6
 9 Italy             6
10 Argentina         5
# ... with 78 more rows

推荐阅读