r - 用R看看哪些产品经常一起买
问题描述
我正在尝试使用 R 创建经常一起购买的产品频率表(按类别)。
我的数据包含以下信息:
OrderID CategoryCode4
On_line_Data2 <- read_excel("On-line Data2.xlsx", col_types =c("text","text"))
实际上就是这样,人们购买了多种产品,我们想要创建一个频率图表,显示“A”与“B”的购买次数;'A' 是用'C' 买的;'A' 与 'D'; 'B' 是和'C' 一起买的;'B' 与 'D'; 'C' 和 'D' 在大量项目中。
orderID 对于每个订单都是唯一的,但可以在每一行重复,因为它是针对每个产品记录的(仅由类别代码表示。每个类别代码可以在每个订单中重复,因此数据可能如下:
OrderID CategoryCode4
---------------------------
Order1 catA
Order1 catA
Order1 catB
Order2 catA
Order2 catB
Order3 catA
Order3 catC
Order4 catA
Order4 catD
Order5 catA
Order5 catE
输出将类似于
CatA & CatB 2
CatA & CatC 1
CatA & CatD 1
CatA & CatE 1
我不在乎输出是否有 ' CatA & CatB = 2
' 以及 ' CatB & CatA = 2
' 或者这等于 3,因为 Order1 中的 A 有 2 倍,尽管这不是主意。
我完全被卡住了,我什至不确定谷歌能够做到这一点。任何帮助将不胜感激。
解决方案
推荐阅读
- javascript - 如何在悬停时获取 img src 值,使用纯 JavaScript 即时编辑和返回它?
- javascript - 单击按钮时,如何添加在画布上水平移动的随机大小的黑色块?
- iterator - 是否可以有条件地应用迭代器转换?
- php - 如何将多个 where 子句变量传递给 bind_param?
- octobercms - 保存用户个人资料详细信息,十月 CMS
- firebase - 是否可以从 linux shell 脚本从 Cloud Storage 检索文档?
- bitbucket - 在 bitbucket 新界面上找不到同步链接和比较按钮
- maven - 如何使用 Maven 故障安全插件来执行预集成步骤
- php - PDF 不使用 artkonekt 下载
- asp.net - 无法将“WhereEnumerableIterator`1[Object]”类型的对象转换为“System.Linq.IQueryable`1[Object]”类型