首页 > 解决方案 > 我想使用遗传算法从 Python 中的事务数据集生成关联规则。有没有可以用作参考的实现?

问题描述

请帮忙!所以我读了几篇关于使用 GA 进行关联规则挖掘的论文。

我的数据集如下所示:

allTransactions = [['egg','bread'],['milk'],['apple','milk'],['ramen'],['ramen','egg','milk'],...]

我使用先验算法从中获取规则,如下所示

Rule: ['egg'] ==> ['milk'] (Conf: 85.71% , Supp: 60.00%) 

Rule: ['china'] ==> ['milk'] (Conf: 100.00% , Supp: 60.00%) 

Rule: ['apple'] ==> ['milk'] (Conf: 100.00% , Supp: 10.00%)

我想使用遗传算法来做同样的事情。我想我必须将项目名称编码为一些二进制字符串,然后将它们输入算法。

我的健身功能会是什么样子?我只为我的先验算法提供了支持和信心,所以我想做类似的事情,这样我就可以比较它了?

如果有针对类似问题的 Python 实现,有人可以指出我或自己有一些想法,这将不胜感激。

标签: pythondata-mininggenetic-algorithm

解决方案


推荐阅读