首页 > 解决方案 > 为什么使用“bcp”进行变化点检测的后验概率分布的最后一个值总是缺失?

问题描述

我正在使用 bcp 包进行变化点检测,我想知道为什么概率分布的最后一个值总是“NA”。我想知道 bcp 算法是否可能需要特定日期之后的数据点才能提供值。我的研究期在 2019 年 12 月 29 日这一周结束,我想知道是否需要额外一周的数据才能真正捕捉到 2019 年 12 月 29 日这一周的研究期。

任何解释将不胜感激。每当我使用 bcp 函数时都会发生这种情况,但我在下面提供了一个可重现的示例:

套餐:

library(gtrendsR)
library(tidyverse)
library(bcp)

提取示例 Google 趋势数据:

data = gtrends('stackoverflow', geo = "US-OR", time = "2018-04-01 2019-12-31")$interest_over_time %>% 
  select(-time:-category)

使用 bcp 包:

bcp = bcp(data$hits)
  
prob = bcp$posterior.prob
prob = as.data.frame(prob) 

bcp_dataframe = cbind(data, prob) %>% 
    select(date, prob)

结果数据框:

在此处输入图像描述

标签: rtime-seriesbayesian

解决方案


推荐阅读