首页 > 解决方案 > 在R中保持小于大于实数的行

问题描述

我有一个大型数据集,变量包括不同的格式,例如 2、3、>2、<4、“我去 <> 上学”。“我需要<在那里”。

如何制作仅包含 < 2 或 > 10 (小于或大于数字)等行的数据集子集?

Subject   Result
1           3
2           4
3           <4
4           <3
5          I need to go to school<>
6          I need to <> be there
7          2.3 need to be< there

标签: rgsub

解决方案


df[grep("^\\s*[<>][0-9]+$", df$variable),]

这将生成df所有行的子集,其中列中的数据variable格式为前面有 < 或 > 的数字,后面只有数字。

我添加\\s*是因为从您的数据看来,某些情况在数字前有填充空格,因此这将删除任何此类空格。


推荐阅读