首页 > 解决方案 > 如果时间跨度重叠且少于 30 分钟,则对日志条目进行分组?

问题描述

我有以下列格式存在的单个用户的日志条目:

[unique id], [start time],[ end time]

因此,在以下示例条目中:

1,1100,1200
2,1030,1130
3,1420,1500
4,1519,1700

查找会话,即将日志条目分组为“会话”。确定会话的条件是:

  1. 如果两个条目时间跨度重叠,则它们属于同一会话。
  2. 或者如果不重叠,但在 < 30 之间的差距,那么它们属于同一个会话。

示例:输出应如下所示:

Session 1: 1, 2
Session 2: 3, 4

我在想的逻辑是:

我想出了下面的代码,但我对如何处理上面的第 3 点逻辑感到困惑。

  private static List<String> groupSessions(List<String> inputs) {
    List<String> output = new ArrayList<>();
    List<LogEntries> entries = new ArrayList<>();
    for (String input : inputs) {
      String[] arr = input.split(",");
      LogEntries entry =
          new LogEntries(Integer.parseInt(arr[0]), Integer.parseInt(arr[1]),
              Integer.parseInt(arr[2]));
      entries.add(entry);
    }

    // sort it basis on startTime
    Collections.sort(entries);

    // now iterate the entries list - this is where I am confuse
    for (int i = 0; i < entries.size(); i++) {
      // do some stuff
    }

    return output;
  }

标签: javaalgorithmdata-structurescollections

解决方案


一些想法:

  • 您将时间戳表示为 int/Integer 值。这允许简单的排序,但会使以后的计算变得更加困难(比如让两个时间戳之间的增量更难)。您可以考虑创建一个不同的类来表示这些小时:分钟值。
  • 解决你的任务:首先在一张纸上做。以您的输入示例为例,首先根据开始时间对该列表进行排序。
  • 查看排序的时间戳,查看第一个条目。显然,这必须是会话的开始。现在您只需查看第一个条目的结束时间和后续条目的开始时间。重叠?然后第一个会话继续到第二个条目的结束时间。没有重叠,然后您计算“开始时间(秒) - 首先结束时间”。小于30分钟?会话继续,因此您再次与下一个结束时间进行比较。否则,会话结束,下一个条目是下一个会话的开始。重复。

长话短说:您必须首先开发告诉您如何确定会话的算法。然后,您将该指令序列转换为代码。关键是首先从概念上将大问题分解成最小的部分,然后看看如何将它们组合在一起。


推荐阅读