首页 > 解决方案 > 在同一个 Java 流中聚合值并转换为单一类型

问题描述

我有一个包含Seed元素集合的类。方法的返回类型之一SeedOptional<Pair<Boolean, String>>.

我正在尝试遍历 all seeds,查找是否有任何booleantrue,同时创建一个包含所有String值的集合。例如,我的输入是表单Optional<Pair<Boolean, String>>,输出应该Optional<Signal>Signal这样的:

class Signal {
   public boolean exposure;

   public Set<String> alarms;

   // constructor and getters (can add anything to this class, it's just a bag)
}

这就是我目前拥有的作品:

// Seed::hadExposure yields Optional<Pair<Boolean, String>> where Pair have key/value or left/right
public Optional<Signal> withExposure() {
  if (seeds.stream().map(Seed::hadExposure).flatMap(Optional::stream).findAny().isEmpty()) {
    return Optional.empty();
  }
  final var exposure = seeds.stream()
      .map(Seed::hadExposure)
      .flatMap(Optional::stream)
      .anyMatch(Pair::getLeft);
  final var alarms = seeds.stream()
      .map(Seed::hadExposure)
      .flatMap(Optional::stream)
      .map(Pair::getRight)
      .filter(Objects::nonNull)
      .collect(Collectors.toSet());
  return Optional.of(new Signal(exposure, alarms));
}

现在我有时间让它变得更好,因为这Seed::hadExposure可能会变得昂贵,所以我试图看看我是否可以只通过一次就完成所有这些。我已经尝试reduce使用收集器(Collectors.collectingAndThen、、Collectors.partitioningBy等)(来自先前问题的一些建议),但到目前为止还没有。

标签: javajava-streamjava-11

解决方案


可以在单个stream()表达式中执行此操作,使用map将非空曝光转换为 a Signal,然后将 areduce组合信号:

Signal signal = exposures.stream()
    .map(exposure ->
        new Signal(
            exposure.getLeft(),
            exposure.getRight() == null
                ? Collections.emptySet()
                : Collections.singleton(exposure.getRight())))
    .reduce(
        new Signal(false, new HashSet<>()),
        (leftSig, rightSig) -> {
            HashSet<String> alarms = new HashSet<>();
            alarms.addAll(leftSig.alarms);
            alarms.addAll(rightSig.alarms);
            return new Signal(
                leftSig.exposure || rightSig.exposure, alarms);
        });

但是,如果您有很多警报,它会很昂贵,因为它会创建一个新Set警报并将新警报添加到输入中每次曝光的累积警报中。

在一种从头开始设计以支持函数式编程的语言(如 Scala 或 Haskell)中,您将拥有一种Set数据类型,可以让您有效地创建一个与现有集合相同但添加了元素的新集合,所以没有效率问题:

filteredSeeds.foldLeft((false, Set[String]())) { (result, exposure) => 
  (result._1 || exposure.getLeft, result._2 + exposure.getRight)
}

但是 Java 并没有开箱即用的东西。

您可以只Set为结果创建一个并在流的reduce表达式中对其进行变异,但有些人会认为这是一种糟糕的风格,因为您将功能范式(在流上映射/减少)与程序范式(改变一个集合)混合)。

就个人而言,在 Java 中,我只是放弃函数式方法并for在这种情况下使用循环。这将是更少的代码、更高效和更清晰的 IMO。

如果您有足够的空间来存储中间结果,则可以执行以下操作:

List<Pair<Boolean, String>> exposures = 
    seeds.stream()
        .map(Seed::hadExposure)
        .flatMap(Optional::stream)
        .collect(Collectors.toList());

然后,您只需Seed::hadExposure在输入列表中的每个项目调用一次昂贵的方法。


推荐阅读