首页 > 解决方案 > R在整个时间段内生成高于/低于平均值的虚拟变量?

问题描述

我有一个 2020 年按月按国家/地区划分的 COVID-19 病例数据集。如果该国家/地区的 COVID-19 病例高于中位数,我想创建一个取值为 1(所有月份)的虚拟变量(在整个期间)。通过这个变量,我将能够将国家划分为病例更多/更少的国家,并检查是否有一些预先存在的条件可以解释这一点。

我如何告诉 R 生成这个新变量?任何帮助将非常感激。

非常感谢!

标签: r

解决方案


推荐阅读