首页 > 解决方案 > 通过包含而不是等于在 R 中设置子集

问题描述

目前正试图在 R 中制作按流派过滤的 IMDb 评级数据帧的子集。使用以下命令averageRatingHorror = subset(df_ratings, df_ratings$genres == "Horror")

我知道这使得数据框的一个子集仅显示与“恐怖”类型相同的结果,但有些电影包含多个类型。例如“恐怖,奇幻”。我在 SQL 中看到了一些类似的东西,你使用 % 来表示之后的任何东西,但有时恐怖不是列表中的第一件事。

所以我的问题是,如何通过包含“恐怖”而不是等于“恐怖”来使命令适应子集

编辑:答案如下averageRatingHorror = subset(df_ratings, grepl("Horror", genres)),感谢那些提供帮助的人。

标签: r

解决方案


您也可以使用 package package stringi。

library(stringi)
stri_detect_fixed(df_ratings$genres,"Horror")

推荐阅读