首页 > 解决方案 > 用R看看哪些产品经常一起买

问题描述

我正在尝试使用 R 创建经常一起购买的产品频率表(按类别)。

我的数据包含以下信息:

OrderID CategoryCode4

On_line_Data2 <- read_excel("On-line Data2.xlsx", col_types =c("text","text"))

实际上就是这样,人们购买了多种产品,我们想要创建一个频率图表,显示“A”与“B”的购买次数;'A' 是用'C' 买的;'A' 与 'D'; 'B' 是和'C' 一起买的;'B' 与 'D'; 'C' 和 'D' 在大量项目中。

orderID 对于每个订单都是唯一的,但可以在每一行重复,因为它是针对每个产品记录的(仅由类别代码表示。每个类别代码可以在每个订单中重复,因此数据可能如下:

   OrderID   CategoryCode4
---------------------------
    Order1    catA
    Order1    catA
    Order1    catB
    Order2    catA
    Order2    catB
    Order3    catA
    Order3    catC
    Order4    catA
    Order4    catD
    Order5    catA
    Order5    catE

输出将类似于

CatA & CatB 2
CatA & CatC 1
CatA & CatD 1
CatA & CatE 1

我不在乎输出是否有 ' CatA & CatB = 2' 以及 ' CatB & CatA = 2' 或者这等于 3,因为 Order1 中的 A 有 2 倍,尽管这不是主意。

我完全被卡住了,我什至不确定谷歌能够做到这一点。任何帮助将不胜感激。

标签: rstatistics

解决方案


推荐阅读