首页 > 解决方案 > 根据变量中的字数创建变量

问题描述

我有一个包含国家及其宪法的数据集。我想知道是否有一种方法可以创建一个变量来显示“上帝”这个词在宪法变量中出现了多少次。

数据集如下所示:

Country Year Preamble
Afghanistan 2004 In the name of Allah...
Albania 1998 We, the people of Albania...
... .... .......

等等等等。我特别想知道是否有一个函数可以计算特定单词在分类变量中使用的次数,或者是否有更好的方法来完成我正在尝试做的事情。

标签: r

解决方案


假设你想计算 'Al' 在上述数据集中出现的次数,你可以像这样使用 grep:

只有一列:

 grep("Al", data$Preamble)

对于所有列:

 lapply(data, function(x) grep("Al", x))
  $`Country`
  [1] 2

  $Year
  integer(0)

  $Preamble
  [1] 1 2

这将告诉您在哪些行和列中找到匹配项,即“国家”列中的一个和“序言”列中的两个


推荐阅读