r - 根据数据集列中的名称设置条件
问题描述
让我们只保留观察次数最多的三个县:索诺玛、洛杉矶和克恩。如果变量是这三个县中的任何一个bigCounties
,则创建一个条件调用。请记住,这是逻辑运算符。TRUE
county
|
or
更新
bigCounties <- isTRUE( CASchools$county == "Sonoma" | CASchools$county == "Los Angeles"|CASchools$county == "Kern")
summary(bigCounties)
输出:
Mode FALSE
logical 1
如何让它遍历整个数据集?
解决方案
我认为你应该尝试%in%
,例如,
CASchools$county %in% c("Sonoma", "Los Amgles", "Kern")
否则,您应该尝试
CASchools$county == "Sonoma"| CASchools$county == "Los Amgles"| CASchools$county =="Kern"
或(感谢@akrun 的贡献)
Reduce(`|`, lapply(c("Sonoma", "Los Amgles", "Kern"), function(x) CASchools$county == x))
如果你想使用|