首页 > 解决方案 > 寻找共同的数据集和旅程路径

问题描述

我有成千上万的数据对象。每个用户通过网站的旅程。每个人在他们访问的每个页面上都有数据以及按什么顺序。我希望能够找到通过该站点的公共路径。

IE

User 1
    Page 1
    Page 2
    Page 3
    Page 4
User 2
    Page 1
    Page 2
    Page 4
User 3
    Page 3
    Page 5
User 4
    Page 1
    Page 2
    Page 5
    Page 4

最常见的路径是 P1、P2、P4(即使有些也转到其他页面)

我正在考虑存储在 mysql 中,但无法完成查询,所以甚至不确定如何存储表?否则我会把它标准化。

或者也许计算必须在 PHP 中,我不能在 PHP 中进行任何类型的计算来解决它?

标签: phpmysql

解决方案


我可能很想将其存储如下:

id user page

这告诉我们我们需要知道的一切。然而,SQL 并不擅长这种分析,但请注意,寻找字符串中的共同序列正是 DNA 研究人员所做的(他们必须挖掘真正大量的数据),所以我想看看他们是如何做到的,然后复制它。


推荐阅读