java - 在开始时创建一个带有可选部分的 DateTimeFormater
问题描述
我有这种结构hh:mm:ss.SSS
的时间码,我有一个自己的类,实现时间接口。它具有自定义字段 TimecodeHour 字段,允许值大于 23 小时。我想用 DateTimeFormatter 解析。小时值是可选的(可以省略,小时可以大于24);作为正则表达式(\d*\d\d:)?\d\d:\d\d.\d\d\d
出于本问题的目的,我的自定义字段可以替换为正常的 HOUR_OF_DAY 字段。
我当前的格式化程序
DateTimeFormatter UNLIMITED_HOURS = new DateTimeFormatterBuilder()
.appendValue(ChronoField.HOUR_OF_DAY, 2, 2,SignStyle.NEVER)
.appendLiteral(':')
.parseDefaulting(TimecodeHour.HOUR, 0)
.toFormatter(Locale.ENGLISH);
DateTimeFormatter TIMECODE = new DateTimeFormatterBuilder()
.appendOptional(UNLIMITED_HOURS)
.appendValue(MINUTE_OF_HOUR, 2)
.appendLiteral(':')
.appendValue(SECOND_OF_MINUTE, 2)
.appendFraction(MILLI_OF_SECOND, 3, 3, true)
.toFormatter(Locale.ENGLISH);
具有小时值的时间码按预期解析,但省略小时的值会引发异常
java.time.format.DateTimeParseException: Text '20:33.123' could not be parsed at index 5
我假设,由于小时和分钟具有相同的模式,解析器从前面开始并捕获可选部分的分钟值。这是正确的,如何解决这个问题?
解决方案
我开始怀疑这20:33.123
并不是要表示一天中的某个时间在午夜过后 20 到 21 分钟之间。也许相当长的时间,比20分钟长一点。如果这是正确的,请使用 a Duration
。
不幸的是,java.time 不包括解析和格式化Duration
非 ISO 8601 格式的方法。这给我们留下了至少三个选择:
- 使用第三方库。Time4J 提供了一个优雅的解决方案,见下文。Joda-Time 有它的
PeriodFormatter
类别。Apache 还可以提供用于解析和格式化持续时间的工具。 - 在解析之前将您的字符串转换为 ISO 8601 格式
Duration.parse()
。 - 编写自己的解析器。
我在想我们对 3. 太懒了,而且 Joda-Time 已经过时了,所以我想在这里选择选项 1. 和 2.,选项 1. 在 Time4J 变体中。
适应 ISO 8601 的正则表达式
ISO 8601 格式一开始感觉很不寻常,但很简单。PT20M33.123S
表示 20 分 33.123 秒。
public static Duration parse(String timeCodeString) {
String iso8601 = timeCodeString
.replaceFirst("^(\\d{2,}):(\\d{2}):(\\d{2}\\.\\d{3})$", "PT$1H$2M$3S")
.replaceFirst("^(\\d{2}):(\\d{2}\\.\\d{3})$", "PT$1M$2S");
return Duration.parse(iso8601);
}
让我们试一试:
System.out.println(parse("20:33.123"));
System.out.println(parse("123:20:33.123"));
输出是:
PT20M33.123S PT123H20M33.123S
我的两个电话是replaceFirst
先用几个小时处理这个案子,然后再用几个小时处理这个案子。因此,要么将与您的正则表达式匹配的字符串转换为 ISO 8601 格式。然后该类对其Duration
进行解析。如您所见,它Duration
还会打印 ISO 8601 格式。但是,以不同的方式格式化它并不坏,请搜索如何。
时间4J
Time4J 库提供了非常优雅的解决方案,与您的思路非常相似。我们真正需要的是这个格式化程序:
private static final Formatter<ClockUnit> TIME_CODE_PARSER
= Duration.formatter(ClockUnit.class, "[###hh:mm:ss.fff][mm:ss.fff]");
像这样简单地使用:
System.out.println(TIME_CODE_PARSER.parse("20:33.123"));
System.out.println(TIME_CODE_PARSER.parse("123:20:33.123"));
PT20M33,123000000S PT123H20M33,123000000S
Time4JDuration
类也打印 ISO 8601 格式。似乎它使用逗号作为 ISO 8601 中首选的小数分隔符,并且当其中一些为 0 时,它也会在秒上打印 9 个小数。
在格式模式中,字符串###hh
表示 2 到 5 位小时,fff
表示秒的小数部分的三位数字。
你的方法有什么问题吗?
你的方法有什么问题吗?ChronoField.HOUR_OF_DAY
意思是:一天中的小时。0 是午夜,12 是中午,23 是接近一天的结束。这不是您想要的,所以是的,您使用了错误的方法。虽然您可能可以让它工作,但在您维护您的代码之后的任何人都会发现它令人困惑,并且可能很难根据您的意图进行修改。
链接
推荐阅读
- html - 仅使用 HTML 更改浏览器宽度时保持 HTML 文本不改变大小?
- swift - Swift:使用整数作为结构中的字段
- reporting-services - 这在SSRS中可能吗?存储过程返回动态列数,如何在表中显示?
- javascript - 对组件中传递的数据的点击事件顺序数组做出反应
- android - 收到推送通知 FCM 时,Flutter 应用程序崩溃,日志中没有错误
- python - 如何在 Pandas 中跨不同数据框进行关键字匹配?
- c# - C# WebApi - Json 序列化将属性提升到更高级别
- c++ - C++中指针和常量的小问题
- python - 如何从 TFRecordData 取回原始字符串数据
- java - Firebase 不验证 IdToken