首页 > 解决方案 > 在开始时创建一个带有可选部分的 DateTimeFormater

问题描述

我有这种结构hh:mm:ss.SSS的时间码,我有一个自己的类,实现时间接口。它具有自定义字段 TimecodeHour 字段,允许值大于 23 小时。我想用 DateTimeFormatter 解析。小时值是可选的(可以省略,小时可以大于24);作为正则表达式(\d*\d\d:)?\d\d:\d\d.\d\d\d

出于本问题的目的,我的自定义字段可以替换为正常的 HOUR_OF_DAY 字段。

我当前的格式化程序

DateTimeFormatter UNLIMITED_HOURS = new DateTimeFormatterBuilder()
    .appendValue(ChronoField.HOUR_OF_DAY, 2, 2,SignStyle.NEVER)
    .appendLiteral(':')
    .parseDefaulting(TimecodeHour.HOUR, 0)
    .toFormatter(Locale.ENGLISH);
DateTimeFormatter TIMECODE = new DateTimeFormatterBuilder()
    .appendOptional(UNLIMITED_HOURS)
    .appendValue(MINUTE_OF_HOUR, 2)
    .appendLiteral(':')
    .appendValue(SECOND_OF_MINUTE, 2)
    .appendFraction(MILLI_OF_SECOND, 3, 3, true)
    .toFormatter(Locale.ENGLISH);

具有小时值的时间码按预期解析,但省略小时的值会引发异常

java.time.format.DateTimeParseException: Text '20:33.123' could not be parsed at index 5

我假设,由于小时和分钟具有相同的模式,解析器从前面开始并捕获可选部分的分钟值。这是正确的,如何解决这个问题?

标签: javadatetime-formatjava-time

解决方案


我开始怀疑这20:33.123并不是要表示一天中的某个时间在午夜过后 20 到 21 分钟之间。也许相当长的时间,比20分钟长一点。如果这是正确的,请使用 a Duration

不幸的是,java.time 不包括解析和格式化Duration非 ISO 8601 格式的方法。这给我们留下了至少三个选择:

  1. 使用第三方库。Time4J 提供了一个优雅的解决方案,见下文。Joda-Time 有它的PeriodFormatter类别。Apache 还可以提供用于解析和格式化持续时间的工具。
  2. 在解析之前将您的字符串转换为 ISO 8601 格式Duration.parse()
  3. 编写自己的解析器。

我在想我们对 3. 太懒了,而且 Joda-Time 已经过时了,所以我想在这里选择选项 1. 和 2.,选项 1. 在 Time4J 变体中。

适应 ISO 8601 的正则表达式

ISO 8601 格式一开始感觉很不寻常,但很简单。PT20M33.123S表示 20 分 33.123 秒。

public static Duration parse(String timeCodeString) {
    String iso8601 = timeCodeString
            .replaceFirst("^(\\d{2,}):(\\d{2}):(\\d{2}\\.\\d{3})$", "PT$1H$2M$3S")
            .replaceFirst("^(\\d{2}):(\\d{2}\\.\\d{3})$", "PT$1M$2S");
    return Duration.parse(iso8601);
}

让我们试一试:

    System.out.println(parse("20:33.123"));
    System.out.println(parse("123:20:33.123"));

输出是:

PT20M33.123S
PT123H20M33.123S

我的两个电话是replaceFirst先用几个小时处理这个案子,然后再用几个小时处理这个案子。因此,要么将与您的正则表达式匹配的字符串转换为 ISO 8601 格式。然后该类对其Duration进行解析。如您所见,它Duration还会打印 ISO 8601 格式。但是,以不同的方式格式化它并不坏,请搜索如何。

时间4J

Time4J 库提供了非常优雅的解决方案,与您的思路非常相似。我们真正需要的是这个格式化程序:

private static final Formatter<ClockUnit> TIME_CODE_PARSER 
        = Duration.formatter(ClockUnit.class, "[###hh:mm:ss.fff][mm:ss.fff]");

像这样简单地使用:

    System.out.println(TIME_CODE_PARSER.parse("20:33.123"));
    System.out.println(TIME_CODE_PARSER.parse("123:20:33.123"));
PT20M33,123000000S
PT123H20M33,123000000S

Time4JDuration类也打印 ISO 8601 格式。似乎它使用逗号作为 ISO 8601 中首选的小数分隔符,并且当其中一些为 0 时,它也会在秒上打印 9 个小数。

在格式模式中,字符串###hh表示 2 到 5 位小时,fff表示秒的小数部分的三位数字。

你的方法有什么问题吗?

你的方法有什么问题吗?ChronoField.HOUR_OF_DAY意思是:一天中的小时。0 是午夜,12 是中午,23 是接近一天的结束。这不是您想要的,所以是的,您使用了错误的方法。虽然您可能可以让它工作,但在您维护您的代码之后的任何人都会发现它令人困惑,并且可能很难根据您的意图进行修改。

链接


推荐阅读