首页 > 解决方案 > 将数组的并行流减少为单个数组

问题描述

我正在尝试将数组 Stream<ArrayList> 的并行流减少为单个数组 ArrayList,因此我将 reduce 方法与累加器和组合器一起使用,如下所示:-

    public static void main(String [] args) {
        ArrayList<String> l1 = new ArrayList<>();
        l1.add("a1");
        l1.add("a2");
        
        List<String> l2 = new ArrayList<>();
        l2.add("a3");
        l2.add("a4");
                
        List<List<String>> l = new ArrayList<>();
        l.add(l1);
        l.add(l2);
        
        Stream<List<String>> stream = l.stream();
        join(stream).forEach(System.out::println);
}

private  static  <T> List<T> join(Stream<List<T>> stream) {
        return stream.parallel().reduce(new ArrayList<>(),  (total, element) -> {
            System.out.println("total: " + total);
            System.out.println("element: " + element);
            total.addAll(element);
            return total;
        },  (total1, total2) -> {
            System.out.println("total1: " + total1);
            System.out.println("total2: " + total2);
            total1.addAll(total2);
            return total1;
        });
}

我知道组合器用于组合并行流..但它没有像我预期的那样工作,因为我得到了如下重复的结果:-

total: []
element: [a3, a4]
total: []
element: [a1, a2]
total1: [a3, a4, a1, a2]
total2: [a3, a4, a1, a2]
a3
a4
a1
a2
a3
a4
a1
a2

那么为什么结果是重复的?在累加器中使用数组列表也是线程安全的吗?

标签: javamultithreadingjava-8java-streamreduce

解决方案


你应该只使用flatMap

返回一个流,其中包含将此流的每个元素替换为通过将提供的映射函数应用于每个元素而生成的映射流的内容的结果。每个映射流在其内容被放入该流后关闭。(如果映射流为空,则使用空流。)

这是一个中间操作。

l.stream().flatMap(x -> x.stream()).collect(Collectors.toList()); // is [a1, a2, a3, a4]

或者

l.stream().flatMap(List::stream).collect(Collectors.toList());

您的代码的问题在于您将函数式代码与副作用混合在一起。这可不是好兆头。如果删除副作用,则输出如预期:

    private static <T> List<T> join(Stream<List<T>> stream) {
        return stream.parallel().reduce(new ArrayList<>(), (total, element) -> {
            System.out.println("total: " + total);
            System.out.println("element: " + element);
            //total.addAll(element);
            //return total;
            var list = new ArrayList<T>(total);
            list.addAll(element);
            return list;
        }, (total1, total2) -> {
            System.out.println("total1: " + total1);
            System.out.println("total2: " + total2);
            //total1.addAll(total2);
            //return total1;
            var list = new ArrayList<T>(total1);
            list.addAll(total2);
            return list;
        });
    }

parallel()除非您有明确、客观的理由,否则您也应该避免使用。并行性是一种开销,只有在有繁重的工作要做时它才会变得更加高效。否则,同步开销将是比任何收益更大的代价。


推荐阅读