首页 > 解决方案 > gtrends r 包 - 随时间变化的点击次数有时会发生变化

问题描述

我在使用 gtrends r 包时遇到了一些问题。我正在使用“R Studio 版本 1.1.463”,运行“R 版本 3.5.1”。

当我搜索特定关键字时,有时点击次数的历史系列会发生很大变化。这是一个例子:

library(gtrendsR)

cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev1$interest_over_time$hits)

cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev2$interest_over_time$hits)

cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev3$interest_over_time$hits)

对于这个简单的代码,我得到的答案如下:

> library(gtrendsR)
> 
> cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev1$interest_over_time$hits)
[1]  0  0 24 46 24 24
> 
> cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev2$interest_over_time$hits)
[1]  0  0 24 46 24 24
> 
> cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev3$interest_over_time$hits)
[1]  70  34  51 100  67  35

如您所见,每次搜索的配置完全相同。但是命中系列在第三个时发生了变化(我只展示了具有“头部”功能的第一个术语,但整个历史系列的“命中”都有变化)。这对于我正在做的其他搜索来说是随机发生的,甚至要求另一种输出,如“interest_by_region$hits”选项。

我在谷歌趋势网站上搜索了数据是如何构建的,我知道一旦“点击”显示相对受欢迎程度或在 0-100 范围内标准化的关键字,“点击”的历史系列可能会发生变化。但是数据的结构应该像我的例子那样改变吗?

我失去了什么吗?

我感谢任何帮助!

非常感谢!

标签: rgtrendsr

解决方案


我也有同样的担忧。您的代码实际上没有缺陷。谷歌似乎随机提取了实际搜索频率的一个子集来计算索引以获得更快的响应。但是,金融领域的一篇著名论文(参见Da et al.(2011)的 p.1467 脚注 4表明,如果你有更长的时间跨度,这个问题将是微不足道的。老实说,当你只要求很的时间时,这个问题就很严重了跨度。在你的情况下,我仍然没有解决方案。


推荐阅读