首页 > 解决方案 > R中的先验算法

问题描述

我正在使用此代码

df_itemList<- read.csv('data.3.txt')

write.csv(df_itemList,"ItemList.csv", row.names = TRUE)

txn = read.transactions(file="ItemList.csv", rm.duplicates= TRUE, format="basket",sep=",",cols=1)

 basket_rules <- apriori(txn,parameter = list(sup = 0.01, conf = 0.5,target="rules"))

在此数据上运行 Apriori Alg在此处输入图像描述

将其转换为 df_itemList.CSV 后如下所示

在此处输入图像描述

该代码运行良好,为包含 99 条记录(行)的数据集生成了大约 29000 条规则

但我的数据有(10000 条记录)

对于任何有 101 条或更多记录的数据集,代码以毫秒为单位执行,并且只给出 4 条无意义的规则......

我在控制台中得到了这个响应

在此处输入图像描述

我的问题是:如何在更大的数据集(超过 99 条记录)上运行 Apriori Alg。或者为什么我的代码不适用于更大的数据集???

标签: rapriori

解决方案


推荐阅读