python - apriori算法中确定频繁项集生成的最小支持阈值
问题描述
我想找到先验算法的最小支持阈值。我知道它完全依赖于用户和数据集,但我发现了一篇使用指数衰减函数的文章。
http://data-mining.philippe-fournier-viger.com/how-to-auto-adjust-the-minimum-support-threshold-according-to-the-data-size/
这是公式所在的链接根据先验算法推导出来。我想知道如何确定常量 'a'、'b' 的值,因为它们也可能因用户而异。'c' 也被认为是最小可能的支持。我使用内置的 pythonmlxtend
包来生成频繁项集,min_support
作为输入之一。那么,我们如何决定'c'apriori
解决方案
必须选择 a、b 和 c 并不比必须选择刚刚超过参数...
我认为这个等式是为了随着数据集的增长而随着时间的推移调整你的参数。但似乎您已经找到了多个合适的参数来计算 a 和 b。
推荐阅读
- ibm-watson - 无法在模型中添加 transaction_id 列以在 watson openscale 上使用
- python - 查找将数据导出到 csv 的 URL
- python - 在 macOS 上安装 psycopg2 失败
- php - Laravel Yajra 上的分页 分页不起作用
- pygame - Pip 和 Python 版本未加载
- python - 以 2 个十进制数作为乘积结果的 Python 乘法
- codeigniter - sess_expiration = 0 的 Codeigniter 3 Redis 会话驱动程序车库集合
- php - Laravel Illuminate\Database\QueryException:找不到驱动程序错误
- php - Laravel 的困惑点与实体关系的实现
- python-3.x - 使用 Beautiful Soup 和 Python 从 wiki 抓取表格数据