首页 > 解决方案 > apriori算法中确定频繁项集生成的最小支持阈值

问题描述

我想找到先验算法的最小支持阈值。我知道它完全依赖于用户和数据集,但我发现了一篇使用指数衰减函数的文章。 http://data-mining.philippe-fournier-viger.com/how-to-auto-adjust-the-minimum-support-threshold-according-to-the-data-size/ 这是公式所在的链接根据先验算法推导出来。我想知道如何确定常量 'a'、'b' 的值,因为它们也可能因用户而异。'c' 也被认为是最小可能的支持。我使用内置的 pythonmlxtend包来生成频繁项集,min_support作为输入之一。那么,我们如何决定'c'apriori

标签: pythondata-miningapriori

解决方案


必须选择 a、b 和 c 并不比必须选择刚刚超过参数...

我认为这个等式是为了随着数据集的增长而随着时间的推移调整你的参数。但似乎您已经找到了多个合适的参数来计算 a 和 b。


推荐阅读