首页 > 技术文章 > Java中的函数式编程(五)Java集合框架中的高阶函数

anyuanwai 2021-10-24 18:24 原文

写在前面

随着Java 8引入了函数式接口和lambda表达式,Java 8中的集合框架(Java Collections Framework, JCF)也增加相应的接口以适应函数式编程。
 
本文的目标是带领大家熟悉Java 8中集合框架新增的常用接口,让我们的代码更简洁、更高级。
 
本文的示例代码可从gitee上获取:https://gitee.com/cnmemset/javafp
 
 

Java 8中的集合框架

首先,和大家从整体上了解Java集合框架。
 
Java集合框架,主要是由两个根接口派生出来的:一个是 Collecton接口,用于存放单个元素;另一个是 Map 接口,主要用于存放键值对。
 
Java集合框架的接口继承结构如下图:
 

 

 
Java 8中,主要是Collection、List和Map三个接口新增了一些方法,部分常用的新增函数如下表所示:
 
接口名
Java8新加入的方法
Collection
forEach(), removeIf(), stream(), parallelStream()
List
replaceAll(), sort()
Map
forEach(), replaceAll(), compute(), computeIfAbsent(), computeIfPresent(), merge()
 
上述这些函数,它们都包含一个函数式接口类型的参数。这类函数有一个专门的术语:高阶函数(high order function)。
 
高阶函数(定义):
一个函数,如果它有一个或多个参数是函数类型的,或者它的返回值是函数类型的,那么我们称这个函数为高阶函数。
 
题外话:
可以发现,这些新增的方法基本都有默认实现(default implementation),这大大减少了具体子类的负担。接口中的默认方法是Java 8的新特性,一个重要的作用就是“接口演化(interface evolution)”。举例说明,假设在Java 8之前,我们有一个类实现了Collection接口:
public class Container implements Collection { ... }

升级到Java 8后,因为Collection中新增了方法 forEach,假设没有默认方法,之前的类 Container 将编译失败。

Collection中的高阶函数

1. forEach

严格来说,forEach方法是定义在接口 Iterable 中的,它的方法签名和默认实现是:
default void forEach(Consumer<? super T> action) {
    Objects.requireNonNull(action);
    for (T t : this) {
        action.accept(t);
    }
}

它的作用是遍历集合中的每一个元素,然后依次对每个元素执行参数 action 指定的动作。参数 action 是一个 Consumer 类型的函数式接口,我们可以通过lambda表达式或方法引用来实现一个 Consumer 。因此,在Java 8或以后的版本中,不要用 for 语句来迭代 Collection 了,不妨使用 forEach 方法。

示例代码如下:

public static void collectionForEach() {
    Collection<String> list = Arrays.asList("Guangdong", "Zhejiang", "Jiangsu");
 
    // for 语句
    for (String s : list) {
        System.out.println(s);
    }
 
    // forEach 方法 + lambda表达式
    list.forEach(s -> System.out.println(s));
 
    // forEach 方法 + 方法引用
    list.forEach(System.out::println);
}

 

2. removeIf

removeIf的方法签名为:
default boolean removeIf(Predicate<? super E> filter) { ... }

removeIf的作用是遍历集合中的每一个元素,然后依次对每个元素进行指定的过滤操作。filter 参数是一个 Predicate 类型的函数式接口。

示例代码如下,假定我们要过滤掉以字母 G 开头的省份:

public static void collectionRemoveIf() {
    List<String> provinces = new ArrayList<>(Arrays.asList("Guangdong", "Jiangsu", "Guangxi", "Jiangxi", "Shandong"));
 
    boolean removed = provinces.removeIf(s -> {
        return s.startsWith("G");
    });
 
    System.out.println(removed);
    System.out.println(provinces);
}

上述代码输出为:

true
[Jiangsu, Jiangxi, Shandong]
 

3. replaceAll

replaceAll的方法签名是:
default void replaceAll(UnaryOperator<E> operator) { ... }

replaceAll方法的作用是对集合中的每个元素执行 operator 指定的计算,并用计算结果替换原来的元素。参数 operator 是类型为 UnaryOperator 的函数式接口,它的参数和返回值类型是相同的。

示例代码如下:将所有的省份的拼音转换为大写字母
public static void listReplaceAll() {
    List<String> provinces = Arrays.asList("Guangdong", "Jiangsu", "Guangxi", "Jiangxi", "Shandong");
    provinces.replaceAll(s -> s.toUpperCase());
    System.out.println(provinces);
}

上述代码的输出为:

[GUANGDONG, JIANGSU, GUANGXI, JIANGXI, SHANDONG]
 

4. sort

sort的方法签名如下:
default void sort(Comparator<? super E> c) { ... }

sort方法是根据比较器 c 指定的排序规则,对 List 中的元素进行排序。参数 c 的类型是Comparator,同样是一个函数式接口。

示例代码:
public static void listSort() {
    List<String> list = Arrays.asList("Guangdong", "Zhejiang", "Jiangsu", "Xizang", "Fujian", "Hunan", "Guangxi");
 
    // 对省份进行排序,首先按照长度排序,如果长度一样,则按照字母顺序排序
    list.sort((first, second) -> {
        int lenDiff = first.length() - second.length();
        return lenDiff == 0 ? first.compareTo(second) : lenDiff;
    });
 
    list.forEach(s -> System.out.println(s));
}

上述代码的输出为:

Hunan
Fujian
Xizang
Guangxi
Jiangsu
Zhejiang
Guangdong
 

5. stream 和 parallelStream

Stream是Java中函数式编程的重要组成部分,我们会在随后的文章中加以详述。
 
 

Map中的高阶函数

1. forEach

和Collection类似,Map中也有forEach方法,它的方法签名和默认实现如下:
default void forEach(BiConsumer<? super K, ? super V> action) { ... }

可以看到,Map的forEach方法的作用是遍历Map中所有的键值对,并执行参数 action 指定的操作。参数 action 的类型是函数式接口 BiConsumer,要求有2个参数,分别代表键值对的key和value。

示例代码:
public static void mapForEach() {
    Map<String, String> cityMap = new HashMap<>();
    cityMap.put("Guangdong", "Guangzhou");
    cityMap.put("Zhejiang", "Hangzhou");
    cityMap.put("Jiangsu", "Nanjing");
 
    cityMap.forEach((key, value) -> {
        System.out.println(String.format("%s 的省会是 %s", key, value));
    });
}

上述代码的输出为:

Guangdong 的省会是 Guangzhou
Zhejiang 的省会是 Hangzhou
Jiangsu 的省会是 Nanjing
 

2. replaceAll

Map的replaceAll的方法签名和默认实现如下:
  
default void replaceAll(BiFunction<? super K, ? super V, ? extends V> function) { ... }

 

和Collection的replaceAll类似,Map的replaceAll方法对Map中的每个键值对执行 operator 指定的计算,并用计算结果替换原来的value值。注意到参数 function 是一个 BiFunction,意味着需要提供这样的一个函数实现:它需要有2个参数,参数类型分别和键类型(K)和值类型(V)一一对应,并且它还需要返回一个类型为值类型(V)的返回值。
示例代码:
public static void mapReplaceAll() {
    Map<String, String> cityMap = new HashMap<>();
    cityMap.put("Guangdong", "Guangzhou");
    cityMap.put("Zhejiang", "Hangzhou");
    cityMap.put("Jiangsu", "Nanjing");

    // 将省府的拼音转换为大写
    cityMap.replaceAll((key, value) -> {
        return value.toUpperCase();
    });

    cityMap.forEach((key, value) -> {
        System.out.println(String.format("%s 的省会大写是 %s", key, value));
    });
}

 

上述代码输出为:
Guangdong 的省会大写是 GUANGZHOU
Zhejiang 的省会大写是 HANGZHOU
Jiangsu 的省会大写是 NANJING
 

3. compute

compute的方法签名:
default V compute(K key,
        BiFunction<? super K, ? super V, ? extends V> remappingFunction) { ... }

 

compute方法的作用是将参数 remappingFunction 的计算结果关联到参数 key 上,但如果计算结果为null,则在Map中删除key的映射。

示例代码如下:

public static void mapCompute() {
    Map<String, String> cityMap = new HashMap<>();
    cityMap.put("Guangdong", "null");
    cityMap.put("Zhejiang", "Hangzhou");
    cityMap.put("Jiangsu", "null");
 
    // 稍显复杂的语句,先调用 forEach 遍历 cityMap 中的键,然后根据原有的键值对计算新的值
    Set keys = new HashSet<>(cityMap.keySet());
    keys.forEach(key -> {
        cityMap.compute(key, (k, v) -> {
            // 如果是 Guangdong,则返回 Guangzhou
            if ("Guangdong".equals(k)) {
                return "Guangzhou";
            }
 
            // 如果旧的键值对中,值是字符串 "null" ,则返回 null。
            // 这意味着 cityMap 会删除对应的key
            if ("null".equals(v)) {
                return null;
            }
 
            // 否则,返回原来的 value 值
            return v;
        });
    });
 
    cityMap.forEach((key, value) -> {
        System.out.println(String.format("%s 的省会是 %s", key, value));
    });
}

上述代码的输出为:

Guangdong 的省会是 Guangzhou
Zhejiang 的省会是 Hangzhou
 
注意到,Jiangsu 已经从cityMap中被删除了。
 

4. computeIfPresent

computeIfPresent的方法签名和默认实现是:
default V computeIfPresent(K key,
        BiFunction<? super K, ? super V, ? extends V> remappingFunction) {
    Objects.requireNonNull(remappingFunction);
    V oldValue;
    if ((oldValue = get(key)) != null) {
        V newValue = remappingFunction.apply(key, oldValue);
        if (newValue != null) {
            put(key, newValue);
            return newValue;
        } else {
            remove(key);
            return null;
        }
    } else {
        return null;
    }
}

 

computeIfPresent 的方法签名和compute一样,作用也和compute类似,但与compute不同的是,只有在Map中存在key并且对应的value非空时,才会调用参数 remappingFunction 指定的计算函数(函数编程特性之惰性求值:只有触发或满足某种条件后,才会执行函数)。如果计算结果为null,则删除key的映射,否则使用该结果替换key原来的映射。

 

5. computeIfAbsent

computeIfAbsent的方法签名和默认实现是:
default V computeIfAbsent(K key,
        Function<? super K, ? extends V> mappingFunction) {
    Objects.requireNonNull(mappingFunction);
    V v;
    if ((v = get(key)) == null) {
        V newValue;
        if ((newValue = mappingFunction.apply(key)) != null) {
            put(key, newValue);
            return newValue;
        }
    }

    return v;
}

 

computeIfAbsent的作用和computeIfPresent 相反,只有在Map中不存在key或对应的value为null时,才调用参数 mappingFunction 指定的计算函数(函数编程特性之惰性求值:只有触发或满足某种条件后,才会执行函数),并且当计算结果非null时,才将计算结果跟key关联。如果计算结果为null,则Map不做任何修改,不会增加新的映射关系。
computeIfAbsent总是会返回操作之后Map中key对应的value,这个value可能是之前已存在的值(如果之前存在的话),也有可能是计算出来的新值。
 
computeIfAbsent特别适合用来初始化Map。假设这么一个实践场景公司里的员工已经有一个“姓名->年龄”的Map了,我们需要根据它来构建一个“年龄->姓名列表”的新Map,此时,使用 computeIfAbsent 会使得代码简洁而有效:
public static void mapComputeIfAbsent() {
    Map<String, Integer> staffMap = new HashMap<>();
    staffMap.put("Lilei", 24);
    staffMap.put("Hanmeimei", 22);
    staffMap.put("Liming", 24);
    staffMap.put("Jim", 22);
    staffMap.put("David", 24);

    Map<Integer, List<String>> staffInvertMap = new HashMap<>();
    staffMap.forEach((key, value) -> {
        // 以年龄为键,构建一个新的Map
        // 以 22 岁为例:
        // 如果 staffInvertMap 之前不存在 22 岁对应的映射关系,
        // 则新建一个 "年龄 -> ArrayList<String>" 的映射,并且把新建的 ArrayList 返回。
        // 如果 staffInvertMap 已经存在 22 岁对应的映射关系了,则将已存在的 ArrayList 返回。
        List<String> nameList = staffInvertMap.computeIfAbsent(value, age -> {
            // 对于同一个 age,这句代码只会执行一次
            return new ArrayList<>();
        });

        nameList.add(key);
    });

    System.out.println(staffInvertMap);
}

 

上述代码的输出为:
{22=[Hanmeimei, Jim], 24=[Lilei, David, Liming]}
 
题外话:
作者特别喜欢computeIfPresent和computeIfAbsent这两个函数,除了它们可以简化我们的代码外,它俩还有一个特性:在ConcurrentHashMap 中,computeIfPresent和computeIfAbsent中的系列操作具备原子性。原子性的含义,欢迎添加公众号,员说,一起讨论。
 

6. merge

merge的方法签名和默认实现为:
default V merge(K key, V value,
        BiFunction<? super V, ? super V, ? extends V> remappingFunction) {
    Objects.requireNonNull(remappingFunction);
    Objects.requireNonNull(value);
    V oldValue = get(key);
    V newValue = (oldValue == null) ? value :
               remappingFunction.apply(oldValue, value);
    if(newValue == null) {
        remove(key);
    } else {
        put(key, newValue);
    }
    return newValue;
}

 

merge方法的作用是合并key对应的旧值和新值:当Map中不存在key对应的映射或者映射值为null时,则将参数 value 关联到 key 上;否则,将旧值 oldValue 和 参数 value 作为函数 remappingFunction 的两个参数,计算得出一个新值,如果新值不为null,则将新值关联到 key 上,如果新值为null,则删除 key 对应的映射关系。
一个典型的场景是针对某个用户进行备注,如果之前有过备注,则将新的备注信息加到后面,示例代码如下:
public static void mapMerge() {
    Map<String, String> staffMap = new HashMap<>();
    staffMap.put("Lilei", "性别男 ");

    // 等价于 staffMap.merge("Lilei", "年龄 24", String::concat)
    // oldValue 即之前添加的值 “性别男 ”,value 即merge函数的第二个参数 “年龄24”
    staffMap.merge("Lilei", " 年龄24", (oldValue, value) -> oldValue.concat(value));
    staffMap.merge("Hanmeimei", "年龄22", String::concat);

    System.out.println(staffMap);
}

 

上述代码的输出为:
{Lilei=性别男 年龄24, Hanmeimei=年龄22}
 
 

结语

Java 8引入了函数式编程,也因此为Java中的集合框架带来了许多新的功能,使得我们能更好的进行函数式编程。
 
作为一个优秀的Java程序员,要有意识的在实际编码中运用这些新方法,使得我们的代码更简洁更清晰。

推荐阅读