r - 在 R 中过滤数据集
问题描述
在这里,我使用 DemocracyIncome 作为我的数据集。可以从R包pder
中获取,代码如下:
library(pder)
data("DemocracyIncome", package = "pder")
df <- na.omit(DemocracyIncome)
部分数据集如下:
country year democracy income sample
Angola 1965-1969 0.1200000 7.963571 0
Angola 1975-1979 0.1666667 7.642973 0
Angola 1980-1984 0.0000000 7.563512 1
Angola 1985-1989 0.0000000 7.528483 1
Angola 1990-1994 0.0000000 7.573770 1
Angola 1995-1999 0.1666667 7.132994 1
Albania 1995-1999 0.6666667 7.947575 1
Albania 2000-2004 0.5000000 8.115600 1
Argentina 1950-1954 0.4900000 8.768732 0
Argentina 1955-1959 0.3000000 8.833524 0
Argentina 1960-1964 0.6300000 8.905374 1
...
现在我想使用每个国家的第一次观察来创建一个新数据集,这应该是
country year democracy income sample
Angola 1965-1969 0.1200000 7.963571 0
Albania 1995-1999 0.6666667 7.947575 1
Argentina 1950-1954 0.4900000 8.768732 0
...
那么如何过滤 df 并获取这个新数据集呢?
解决方案
我们可以用duplicated
在base R
df_filter <- df[!duplicated(df$country),]
或与distinct
library(dplyr)
distinct(df, country, .keep_all = TRUE)
推荐阅读
- selenium - 如何为硒网格设置自定义浏览器版本?
- javascript - Apollo 查询触发并导致在 URL 更改时在 useContext 中重新呈现
- python - 使用 Python Paramiko exec_command 执行命令时未完成
- swift - PropertyListEncoder 忽略 .binary outputFormat
- amazon-web-services - S3 BucketSizeBytes 指标是否显示字节或字节/天?
- macos - NSCollectionViewCompositionalLayout 可以支持“生长细胞”吗
- reactjs - 在 react-select 中使用自定义样式时,为什么“没有重载匹配此调用”TypeScript 错误?
- java - jOOQ:在 select 语句之前设置 where 条件
- javascript - 如何将数组与另一个对象数组映射并用另一个数组对象值替换第一个数组元素
- powershell - Exchange Online:更改会议时间的时区?