java - 在同一个 Java 流中聚合值并转换为单一类型
问题描述
我有一个包含Seed
元素集合的类。方法的返回类型之一Seed
是Optional<Pair<Boolean, String>>
.
我正在尝试遍历 all seeds
,查找是否有任何boolean
值true
,同时创建一个包含所有String
值的集合。例如,我的输入是表单Optional<Pair<Boolean, String>>
,输出应该Optional<Signal>
是Signal
这样的:
class Signal {
public boolean exposure;
public Set<String> alarms;
// constructor and getters (can add anything to this class, it's just a bag)
}
这就是我目前拥有的作品:
// Seed::hadExposure yields Optional<Pair<Boolean, String>> where Pair have key/value or left/right
public Optional<Signal> withExposure() {
if (seeds.stream().map(Seed::hadExposure).flatMap(Optional::stream).findAny().isEmpty()) {
return Optional.empty();
}
final var exposure = seeds.stream()
.map(Seed::hadExposure)
.flatMap(Optional::stream)
.anyMatch(Pair::getLeft);
final var alarms = seeds.stream()
.map(Seed::hadExposure)
.flatMap(Optional::stream)
.map(Pair::getRight)
.filter(Objects::nonNull)
.collect(Collectors.toSet());
return Optional.of(new Signal(exposure, alarms));
}
现在我有时间让它变得更好,因为这Seed::hadExposure
可能会变得昂贵,所以我试图看看我是否可以只通过一次就完成所有这些。我已经尝试reduce
使用收集器(Collectors.collectingAndThen
、、Collectors.partitioningBy
等)(来自先前问题的一些建议),但到目前为止还没有。
解决方案
可以在单个stream()
表达式中执行此操作,使用map
将非空曝光转换为 a Signal
,然后将 areduce
组合信号:
Signal signal = exposures.stream()
.map(exposure ->
new Signal(
exposure.getLeft(),
exposure.getRight() == null
? Collections.emptySet()
: Collections.singleton(exposure.getRight())))
.reduce(
new Signal(false, new HashSet<>()),
(leftSig, rightSig) -> {
HashSet<String> alarms = new HashSet<>();
alarms.addAll(leftSig.alarms);
alarms.addAll(rightSig.alarms);
return new Signal(
leftSig.exposure || rightSig.exposure, alarms);
});
但是,如果您有很多警报,它会很昂贵,因为它会创建一个新Set
警报并将新警报添加到输入中每次曝光的累积警报中。
在一种从头开始设计以支持函数式编程的语言(如 Scala 或 Haskell)中,您将拥有一种Set
数据类型,可以让您有效地创建一个与现有集合相同但添加了元素的新集合,所以没有效率问题:
filteredSeeds.foldLeft((false, Set[String]())) { (result, exposure) =>
(result._1 || exposure.getLeft, result._2 + exposure.getRight)
}
但是 Java 并没有开箱即用的东西。
您可以只Set
为结果创建一个并在流的reduce
表达式中对其进行变异,但有些人会认为这是一种糟糕的风格,因为您将功能范式(在流上映射/减少)与程序范式(改变一个集合)混合)。
就个人而言,在 Java 中,我只是放弃函数式方法并for
在这种情况下使用循环。这将是更少的代码、更高效和更清晰的 IMO。
如果您有足够的空间来存储中间结果,则可以执行以下操作:
List<Pair<Boolean, String>> exposures =
seeds.stream()
.map(Seed::hadExposure)
.flatMap(Optional::stream)
.collect(Collectors.toList());
然后,您只需Seed::hadExposure
在输入列表中的每个项目调用一次昂贵的方法。
推荐阅读
- regex - 使用字符串匹配优化列表理解
- python - 将 nlp.pipe() 与带有 spaCy 的预分段和预标记文本一起使用
- javascript - 如何在 vuejs 项目中导入和使用 luxon?
- javascript - 在 mousemove 上更改图像的位置
- c# - 具有共享接口的 C# 静态对象 - 这可行吗?
- sql - 如何使用 case 语句在 select 语句中应用 datediff 函数
- python - 如何打乱元组列表?
- python - 导出到 csv 文件时如何阻止数据溢出到下一行以及如何使用 Python 捕获 HTTP 错误
- android - 根据从 Firebase 收到的命令重新启动活动
- java - 如何解析具有列表的对象