JDK8 Stream、Collector 浅析(一)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JDK8 Stream、Collector 浅析(一)相关的知识,希望对你有一定的参考价值。

参考技术A

A sequence of elements supporting sequential and parallel aggregate operations

流是一个支持串行和并行的聚合操作的元素序列。(有点抽象。。)

流可以认为是对集合功能上的增强,能对集合对象实现更高效、更便利的操作。但是 流不是数据结构,流本身不储存数据,只是从源 (集合是流使用最多的源,下面会介绍其他的源) 中获取数据, 并进行相应的计算 ——对流的操作会生成一个结果, 不会修改数据源。

为什么需要它们?

使用Stream之后,可以让我们的代码变得更加精简、更加易读;但其实使用难度是提高的。

filter invoked

filter invoked

map invoked

filter invoked

[2 java]

一个Collector对象也是由Supplier、accumulator、combiner组成的

Supplier 在流的计算过程中,提供容器,供后续 accumulator 和 combiner 使用

accumulator 为累加器,将stream中U元素加入到T中,(list, item) -> list.add( item) 就可以作为一个累加器

combiner为合并器,用来将所有accumulator处理后的容器结果进行合并,在并行流中,也就是多线程下才会被使用到,此次分享只讲串行流。像下面中(list11, list22) -> list11.addAll (list22)就可以作为一个合并器

JDK1.8新特性——Collector接口和Collectors工具类

JDK1.8新特性——Collector接口和Collectors工具类

摘要:本文主要学习了在Java1.8中新增的Collector接口和Collectors工具类,以及使用它们在处理集合时的改进和优化。

部分内容来自以下博客:

https://www.jianshu.com/p/7eaa0969b424

流式处理

JDK1.8中新增的流式处理提供了一种高效且易于使用的处理数据的方式,它可以对集合执行非常复杂的查找、过滤和映射数据等操作,极大的简化了对于集合的使用。借助流式处理,可以像使用SQL语句一样对集合进行操作。

JDK1.8通过内部迭代来实现对流的处理,一个流式处理可以分为三个部分:转换成流、中间操作、终止操作。

转换成流

对于集合,可以使用集合类中的stream()方法或者parallelStream()方法将集合转换成流。

中间操作

中间操作可以对流进行处理并返回处理后的流对象,多个中间操作可以连接起来形成一个流水线,直到执行终止操作结束流的执行。

终止操作

终止操作会对经过中间操作后得到的流进行处理,返回任何不是流的数据。

Collector接口

在对流进行的终止操作中,有一个方法是collect,其作用是收集元素并进行处理,最终返回处理后的非流对象。

查看其方法定义如下:

1 <R, A> R collect(Collector<? super T, A, R> collector);

可以看到,collect方法要求传入一个Collector接口的实例对象,Collector可以看做是用来处理流的工具,在Collectors里面封装了很多Collector工具。

全局变量

Collector主要包含五个参数,它的行为也是由这五个参数来定义的,如下所示:

 1 // supplier参数用于生成结果容器,容器类型为A。
 2 Supplier<A> supplier();
 3 // accumulator用于归纳元素,泛型T就是元素,它会将流中的元素同结果容器A发生操作。
 4 BiConsumer<A, T> accumulator();
 5 // combiner用于合并两个并行执行的结果,将其合并为最终结果A。
 6 BinaryOperator<A> combiner();
 7 // finisher用于将之前完整的结果R转为A。
 8 Function<A, R> finisher();
 9 // characteristics表示当前Collector的特征值,是一个不可变的Set。
10 Set<Characteristics> characteristics();

枚举

Characteristics这个特征值是一个枚举:

1 enum Characteristics {
2     // 多线程并行。
3     CONCURRENT,
4     // 无序。
5     UNORDERED,
6     // 无需转换结果。
7     IDENTITY_FINISH
8 }

构造方法

Collector拥有两个of方法用于生成Collector实例,其中一个拥有上面所有五个参数,另一个四个参数,不包括finisher参数。

 1 // 四参方法,用于生成一个Collector,T代表流中的元素,R代表最终的结果。因为没有finisher参数,所以需要有IDENTITY_FINISH特征值。
 2 public static<T, R> Collector<T, R, R> of(Supplier<R> supplier,
 3                                           BiConsumer<R, T> accumulator,
 4                                           BinaryOperator<R> combiner,
 5                                           Characteristics... characteristics) {
 6     Objects.requireNonNull(supplier);
 7     Objects.requireNonNull(accumulator);
 8     Objects.requireNonNull(combiner);
 9     Objects.requireNonNull(characteristics);
10     Set<Characteristics> cs = (characteristics.length == 0)
11                               ? Collectors.CH_ID
12                               : Collections.unmodifiableSet(EnumSet.of(Collector.Characteristics.IDENTITY_FINISH,
13                                                                        characteristics));
14     return new Collectors.CollectorImpl<>(supplier, accumulator, combiner, cs);
15 }
16 
17 // 五参方法,用于生成一个Collector,T代表流中的元素,A代表中间结果,R代表最终结果,finisher用于将A转换为R。
18 public static<T, A, R> Collector<T, A, R> of(Supplier<A> supplier,
19                                              BiConsumer<A, T> accumulator,
20                                              BinaryOperator<A> combiner,
21                                              Function<A, R> finisher,
22                                              Characteristics... characteristics) {
23     Objects.requireNonNull(supplier);
24     Objects.requireNonNull(accumulator);
25     Objects.requireNonNull(combiner);
26     Objects.requireNonNull(finisher);
27     Objects.requireNonNull(characteristics);
28     Set<Characteristics> cs = Collectors.CH_NOID;
29     if (characteristics.length > 0) {
30         cs = EnumSet.noneOf(Characteristics.class);
31         Collections.addAll(cs, characteristics);
32         cs = Collections.unmodifiableSet(cs);
33     }
34     return new Collectors.CollectorImpl<>(supplier, accumulator, combiner, finisher, cs);
35 }

Collectors工具类

Collectors是一个工具类,是JDK预实现Collector的工具类,它内部提供了多种Collector。

toCollection方法

将流中的元素全部放置到一个集合中返回,这里使用Collection,泛指多种集合。

方法:

1 public static <T, C extends Collection<T>> Collector<T, ?, C> toCollection(Supplier<C> collectionFactory) {
2     return new CollectorImpl<>(
3             collectionFactory, Collection<T>::add,
4             (r1, r2) -> { r1.addAll(r2); return r1; }, 
5             CH_ID);
6 }

实例:

1 public static void main(String[] args) {
2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
4     LinkedList<String> newList = list.stream().collect(Collectors.toCollection(LinkedList::new));
5     System.out.println(newList);// [123, 521, 100, 228, 838, 250, 345]
6 }

toList方法

将流中的元素放置到一个List集合中返回,默认为ArrayList。

方法:

1 public static <T>
2 Collector<T, ?, List<T>> toList() {
3     return new CollectorImpl<>(
4             (Supplier<List<T>>) ArrayList::new, List::add,
5             (left, right) -> { left.addAll(right); return left; },
6             CH_ID);
7 }

实例:

1 public static void main(String[] args) {
2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
4     List<String> newList = list.stream().collect(Collectors.toList());
5     System.out.println(newList);// [123, 521, 100, 228, 838, 250, 345]
6 }

toSet方法

将流中的元素放置到一个Set集合中返回,默认为HashSet。

方法:

1 public static <T> Collector<T, ?, Set<T>> toSet() {
2     return new CollectorImpl<>(
3             (Supplier<Set<T>>) HashSet::new, Set::add,
4             (left, right) -> { left.addAll(right); return left; },
5             CH_UNORDERED_ID);
6 }

实例:

1 public static void main(String[] args) {
2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
4     Set<String> newSet = list.stream().collect(Collectors.toSet());
5     System.out.println(newSet);// [100, 123, 521, 345, 228, 838, 250]
6 }

toMap方法

根据传入的键生成器和值生成器,将生成的键和值保存到一个Map中返回,键和值的生成都依赖于元素,可以指定出现重复键时的处理方案和保存结果的Map。

还有支持并发toConcurrentMap方法,同样有三种重载方法,与toMap基本一致,只是它最后使用的Map是并发ConcurrentHashMap。

方法:

 1 // 指定键和值的生成方式,遇到键冲突的情况默认抛出异常,默认使用HashMap。
 2 public static <T, K, U> Collector<T, ?, Map<K,U>> toMap(
 3             Function<? super T, ? extends K> keyMapper,
 4             Function<? super T, ? extends U> valueMapper) {
 5     return toMap(keyMapper, valueMapper, throwingMerger(), HashMap::new);
 6 }
 7 // 指定键和值的生成方式,遇到键冲突的情况使用传入的方法处理,默认使用HashMap。
 8 public static <T, K, U> Collector<T, ?, Map<K,U>> toMap(
 9             Function<? super T, ? extends K> keyMapper,
10             Function<? super T, ? extends U> valueMapper,
11             BinaryOperator<U> mergeFunction) {
12     return toMap(keyMapper, valueMapper, mergeFunction, HashMap::new);
13 }
14 // 指定键和值的生成方式,遇到键冲突的情况使用传入的方法处理,使用传入的Map类型返回数据。前两种方式最终还是调用此方法来返回Map数据。
15 public static <T, K, U, M extends Map<K, U>> Collector<T, ?, M> toMap(
16             Function<? super T, ? extends K> keyMapper,
17             Function<? super T, ? extends U> valueMapper,
18             BinaryOperator<U> mergeFunction,
19             Supplier<M> mapSupplier) {
20     BiConsumer<M, T> accumulator = (map, element) -> map.merge(
21             keyMapper.apply(element), 
22             valueMapper.apply(element), 
23             mergeFunction);
24     return new CollectorImpl<>(mapSupplier, accumulator, mapMerger(mergeFunction), CH_ID);
25 }

实例:

 1 public static void main(String[] args) {
 2     Map<String, String> newMap = null;
 3     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
 4     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
 5     // 123和100的键都是1,导致冲突,默认抛出异常,使用limit截取前两个元素。
 6     newMap = list.stream().limit(2).collect(Collectors.toMap(e -> e.substring(0, 1), e -> e));
 7     System.out.println(newMap);// {1=123, 5=521}
 8     // 传入主键冲突时的处理方法,保留先插入的值,默认使用HashMap,对主键由小到大排序。
 9     newMap = list.stream().collect(Collectors.toMap(e -> e.substring(0, 1), e -> e, (m, n) -> m));
10     System.out.println(newMap);// {1=123, 2=228, 3=345, 5=521, 8=838}
11     // 传入主键冲突时的处理方法,保留新插入的值,默认使用LinkedHashMap,对主键按照插入顺序排序。
12     newMap = list.stream().collect(Collectors.toMap(e -> e.substring(0, 1), e -> e, (m, n) -> n, LinkedHashMap::new));
13     System.out.println(newMap);// {1=100, 5=521, 2=250, 8=838, 3=345}
14 }

joining方法

将流中的元素全部以字符串的方式连接到一起,可以指定连接符,也可以指定前后缀。

方法:

 1 // 将流中的元素全部以字符串的方式连接到一起,不使用连接符,也不指定前后缀。
 2 public static Collector<CharSequence, ?, String> joining() {
 3     return new CollectorImpl<CharSequence, StringBuilder, String>(
 4             StringBuilder::new, StringBuilder::append,
 5             (r1, r2) -> { r1.append(r2); return r1; },
 6             StringBuilder::toString, CH_NOID);
 7 }
 8 // 将流中的元素全部以字符串的方式连接到一起,使用指定的连接符,不指定前后缀。
 9 public static Collector<CharSequence, ?, String> joining(CharSequence delimiter) {
10     return joining(delimiter, "", "");
11 }
12 // 将流中的元素全部以字符串的方式连接到一起,使用指定的连接符,使用指定的前后缀。
13 public static Collector<CharSequence, ?, String> joining(CharSequence delimiter,
14                                                          CharSequence prefix,
15                                                          CharSequence suffix) {
16     return new CollectorImpl<>(
17             () -> new StringJoiner(delimiter, prefix, suffix),
18             StringJoiner::add, StringJoiner::merge,
19             StringJoiner::toString, CH_NOID);
20 }

实例:

 1 public static void main(String[] args) {
 2     String str = null;
 3     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
 4     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
 5     str = list.stream().collect(Collectors.joining());
 6     System.out.println(str);// 123521100228838250345
 7     str = list.stream().collect(Collectors.joining("-"));
 8     System.out.println(str);// 123-521-100-228-838-250-345
 9     str = list.stream().collect(Collectors.joining("-", "<", ">"));
10     System.out.println(str);// <123-521-100-228-838-250-345>
11 }

mapping方法

将流中的元素按照传入的方法进行处理,并将结果按照指定的格式返回。

方法:

 1 public static <T, U, A, R>
 2 Collector<T, ?, R> mapping(
 3             Function<? super T, ? extends U> mapper,
 4             Collector<? super U, A, R> downstream) {
 5     BiConsumer<A, ? super U> downstreamAccumulator = downstream.accumulator();
 6     return new CollectorImpl<>(
 7             downstream.supplier(),
 8             (r, t) -> downstreamAccumulator.accept(r, mapper.apply(t)),
 9             downstream.combiner(),
10             downstream.finisher(),
11             downstream.characteristics());
12 }

实例:

1 public static void main(String[] args) {
2     List<Score> scoreList = new ArrayList<Score>();
3     scoreList.add(new Score("2019", "10", "张三", 1));
4     scoreList.add(new Score("2019", "11", "李四", 1));
5     scoreList.add(new Score("2019", "12", "王五", 1));
6     List<String> names = scoreList.stream().collect(Collectors.mapping(Score::getName, Collectors.toList()));
7     System.out.println(names);// [张三, 李四, 王五]
8 }

collectingAndThen方法

该方法是按照传入的collector处理完之后,对归纳的结果进行再处理。

方法:

 1 public static<T,A,R,RR> Collector<T,A,RR> collectingAndThen(
 2             Collector<T,A,R> downstream,
 3             Function<R,RR> finisher) {
 4     Set<Collector.Characteristics> characteristics = downstream.characteristics();
 5     if (characteristics.contains(Collector.Characteristics.IDENTITY_FINISH)) {
 6         if (characteristics.size() == 1)
 7             characteristics = Collectors.CH_NOID;
 8         else {
 9             characteristics = EnumSet.copyOf(characteristics);
10             characteristics.remove(Collector.Characteristics.IDENTITY_FINISH);
11             characteristics = Collections.unmodifiableSet(characteristics);
12         }
13     }
14     return new CollectorImpl<>(downstream.supplier(),
15                                downstream.accumulator(),
16                                downstream.combiner(),
17                                downstream.finisher().andThen(finisher),
18                                characteristics);
19 }

实例:

1 public static void main(String[] args) {
2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
4     Integer size = list.stream().collect(Collectors.collectingAndThen(Collectors.toList(), List::size));
5     System.out.println(size);// 7
6 }

counting方法

该方法主要用来计数。

方法:

1 public static <T> Collector<T, ?, Long> counting() {
2     return reducing(0L, e -> 1L, Long::sum);
3 }

实例:

1 public static void main(String[] args) {
2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
4     Long count = list.stream().collect(Collectors.counting());
5     System.out.println(count);// 7
6 }

reducing方法

对流中的元素做统计归纳,有三个重载方法,和Stream里的三个reduce方法对应,二者是可以替换使用的,作用完全一致。

方法:

 1 // 返回一个可以直接产生Optional类型结果的Collector,没有初始值。
 2 public static <T> Collector<T, ?, Optional<T>> reducing(BinaryOperator<T> op) {
 3     class OptionalBox implements Consumer<T> {
 4         T value = null;
 5         boolean present = false;
 6 
 7         @Override
 8         public void accept(T t) {
 9             if (present) {
10                 value = op.apply(value, t);
11             }
12             else {
13                 value = t;
14                 present = true;
15             }
16         }
17     }
18     return new CollectorImpl<T, OptionalBox, Optional<T>>(
19             OptionalBox::new, OptionalBox::accept,
20             (a, b) -> { if (b.present) a.accept(b.value); return a; },
21             a -> Optional.ofNullable(a.value), CH_NOID);
22 }
23 // 返回一个可以直接产生结果的Collector,指定初始值。
24 public static <T> Collector<T, ?, T> reducing(T identity, BinaryOperator<T> op) {
25     return new CollectorImpl<>(
26             boxSupplier(identity),
27             (a, t) -> { a[0] = op.apply(a[0], t); },
28             (a, b) -> { a[0] = op.apply(a[0], b[0]); return a; },
29             a -> a[0],
30             CH_NOID);
31 }
32 // 返回一个可以直接产生结果的Collector,指定初始值,在返回结果之前先使用传入的方法将流进行转换。
33 public static <T, U> Collector<T, ?, U> reducing(
34             U identity,
35             Function<? super T, ? extends U> mapper,
36             BinaryOperator<U> op) {
37     return new CollectorImpl<>(
38             boxSupplier(identity),
39             (a, t) -> { a[0] = op.apply(a[0], mapper.apply(t)); },
40             (a, b) -> { a[0] = op.apply(a[0], b[0]); return a; },
41             a -> a[0], CH_NOID);
42 }

实例:

 1 public static void main(String[] args) {
 2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
 3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
 4     Optional<Integer> optional = list.stream().limit(4).map(String::length).collect(Collectors.reducing(Integer::sum));
 5     System.out.println(optional);// Optional[12]
 6     Integer integer = list.stream().limit(3).map(String::length).collect(Collectors.reducing(0, Integer::sum));
 7     System.out.println(integer);// 9
 8     Integer sum = list.stream().limit(4).collect(Collectors.reducing(0, String::length, Integer::sum));
 9     System.out.println(sum);// 12
10 }

minBy方法和maxBy方法

生成一个用于获取最小值或者最大值的Optional结果的Collector。

方法:

1 public static <T> Collector<T, ?, Optional<T>> minBy(Comparator<? super T> comparator) {
2     return reducing(BinaryOperator.minBy(comparator));
3 }
4 public static <T> Collector<T, ?, Optional<T>> maxBy(Comparator<? super T> comparator) {
5     return reducing(BinaryOperator.maxBy(comparator));
6 }

实例:

1 public static void main(String[] args) {
2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
4     Optional<String> max = list.stream().collect(Collectors.maxBy((m, n) -> Integer.valueOf(m) - Integer.valueOf(n)));
5     System.out.println(max);// Optional[838]
6     Optional<String> min = list.stream().collect(Collectors.minBy((m, n) -> Integer.valueOf(m) - Integer.valueOf(n)));
7     System.out.println(min);// Optional[100]
8 }

summingInt方法、summingLong方法和summingDouble方法

生成一个用于求元素和的Collector,首先将元素转换类型,然后再求和。

参数的作用就是将元素转换为指定的类型,最后结果与转换后类型一致。

方法:

 1 public static <T> Collector<T, ?, Integer> summingInt(ToIntFunction<? super T> mapper) {
 2     return new CollectorImpl<>(
 3             () -> new int[1],
 4             (a, t) -> { a[0] += mapper.applyAsInt(t); },
 5             (a, b) -> { a[0] += b[0]; return a; },
 6             a -> a[0], CH_NOID);
 7 }
 8 public static <T> Collector<T, ?, Long> summingLong(ToLongFunction<? super T> mapper) {
 9     return new CollectorImpl<>(
10             () -> new long[1],
11             (a, t) -> { a[0] += mapper.applyAsLong(t); },
12             (a, b) -> { a[0] += b[0]; return a; },
13             a -> a[0], CH_NOID);
14 }
15 public static <T> Collector<T, ?, Double> summingDouble(ToDoubleFunction<? super T> mapper) {
16     return new CollectorImpl<>(
17             () -> new double[3],
18             (a, t) -> { sumWithCompensation(a, mapper.applyAsDouble(t));
19                         a[2] += mapper.applyAsDouble(t); },
20             (a, b) -> { sumWithCompensation(a, b[0]);
21                         a[2] += b[2]; return sumWithCompensation(a, b[1]); },
22             a -> computeFinalSum(a), CH_NOID);
23 }

实例:

 1 public static void main(String[] args) {
 2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
 3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
 4     Integer intCollect = list.stream().collect(Collectors.summingInt(Integer::parseInt));
 5     System.out.println(intCollect);// 2405
 6     Long longCollect = list.stream().collect(Collectors.summingLong(Long::parseLong));
 7     System.out.println(longCollect);// 2405
 8     Double doubleCollect = list.stream().collect(Collectors.summingDouble(Double::parseDouble));
 9     System.out.println(doubleCollect);// 2405.0
10 }

summarizingInt方法、summarizingLong方法和summarizingDouble方法

这三个方法适用于汇总的,返回值分别是IntSummaryStatistics、LongSummaryStatistics和DoubleSummaryStatistics。

在这些返回值中包含有流中元素的指定结果的数量、和、最大值、最小值、平均值。

方法:

 1 public static <T> Collector<T, ?, IntSummaryStatistics> summarizingInt(ToIntFunction<? super T> mapper) {
 2     return new CollectorImpl<T, IntSummaryStatistics, IntSummaryStatistics>(
 3             IntSummaryStatistics::new,
 4             (r, t) -> r.accept(mapper.applyAsInt(t)),
 5             (l, r) -> { l.combine(r); return l; }, CH_ID);
 6 }
 7 public static <T> Collector<T, ?, LongSummaryStatistics> summarizingLong(ToLongFunction<? super T> mapper) {
 8     return new CollectorImpl<T, LongSummaryStatistics, LongSummaryStatistics>(
 9             LongSummaryStatistics::new,
10             (r, t) -> r.accept(mapper.applyAsLong(t)),
11             (l, r) -> { l.combine(r); return l; }, CH_ID);
12 }
13 public static <T> Collector<T, ?, DoubleSummaryStatistics> summarizingDouble(ToDoubleFunction<? super T> mapper) {
14     return new CollectorImpl<T, DoubleSummaryStatistics, DoubleSummaryStatistics>(
15             DoubleSummaryStatistics::new,
16             (r, t) -> r.accept(mapper.applyAsDouble(t)),
17             (l, r) -> { l.combine(r); return l; }, CH_ID);
18 }

实例:

 1 public static void main(String[] args) {
 2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
 3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
 4     IntSummaryStatistics intSummaryStatistics = list.stream().collect(Collectors.summarizingInt(Integer::parseInt));
 5     System.out.println(intSummaryStatistics);// {count=7, sum=2405, min=100, average=343.571429, max=838}
 6     LongSummaryStatistics longSummaryStatistics = list.stream().collect(Collectors.summarizingLong(Long::parseLong));
 7     System.out.println(longSummaryStatistics);// {count=7, sum=2405, min=100, average=343.571429, max=838}
 8     DoubleSummaryStatistics doubleSummaryStatistics = list.stream().collect(Collectors.summarizingDouble(Double::parseDouble));
 9     System.out.println(doubleSummaryStatistics);// {count=7, sum=2405.000000, min=100.000000, average=343.571429, max=838.000000}
10 }

averagingInt方法、averagingLong方法和averagingDouble方法

生成一个用于求元素平均值的Collector,首先将元素转换类型,然后再求平均值。

参数的作用就是将元素转换为指定的类型,求平均值涉及到除法操作,结果一律为Double类型。

方法:

 1 public static <T> Collector<T, ?, Double> averagingInt(ToIntFunction<? super T> mapper) {
 2     return new CollectorImpl<>(
 3             () -> new long[2],
 4             (a, t) -> { a[0] += mapper.applyAsInt(t); a[1]++; },
 5             (a, b) -> { a[0] += b[0]; a[1] += b[1]; return a; },
 6             a -> (a[1] == 0) ? 0.0d : (double) a[0] / a[1], CH_NOID);
 7 }
 8 public static <T> Collector<T, ?, Double> averagingLong(ToLongFunction<? super T> mapper) {
 9     return new CollectorImpl<>(
10             () -> new long[2],
11             (a, t) -> { a[0] += mapper.applyAsLong(t); a[1]++; },
12             (a, b) -> { a[0] += b[0]; a[1] += b[1]; return a; },
13             a -> (a[1] == 0) ? 0.0d : (double) a[0] / a[1], CH_NOID);
14 }
15 public static <T> Collector<T, ?, Double> averagingDouble(ToDoubleFunction<? super T> mapper) {
16     return new CollectorImpl<>(
17             () -> new double[4],
18             (a, t) -> { sumWithCompensation(a, mapper.applyAsDouble(t)); a[2]++; a[3]+= mapper.applyAsDouble(t); },
19             (a, b) -> { sumWithCompensation(a, b[0]); sumWithCompensation(a, b[1]); a[2] += b[2]; a[3] += b[3]; return a; },
20             a -> (a[2] == 0) ? 0.0d : (computeFinalSum(a) / a[2]), CH_NOID);
21 }

实例:

 1 public static void main(String[] args) {
 2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
 3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
 4     double intAverage = list.stream().collect(Collectors.averagingInt(Integer::parseInt));
 5     System.out.println(intAverage);// 343.57142857142856
 6     double longAverage = list.stream().collect(Collectors.averagingLong(Long::parseLong));
 7     System.out.println(longAverage);// 343.57142857142856
 8     double doubleAverage = list.stream().collect(Collectors.averagingDouble(Double::parseDouble));
 9     System.out.println(doubleAverage);// 343.57142857142856
10 }

groupingBy方法

生成一个拥有分组功能的Collector,有三个重载方法。

方法:

 1 // 只需一个分组参数classifier,内部自动将结果保存到一个Map中,每个Map键的类型即classifier的结果类型,默认将组的元素保存在List中。
 2 public static <T, K> Collector<T, ?, Map<K, List<T>>> groupingBy(
 3             Function<? super T, ? extends K> classifier) {
 4     return groupingBy(classifier, toList());
 5 }
 6 // 在上面方法的基础上增加了对流中元素的处理方式的Collector,默认是List。
 7 public static <T, K, A, D> Collector<T, ?, Map<K, D>> groupingBy(
 8             Function<? super T, ? extends K> classifier,
 9             Collector<? super T, A, D> downstream) {
10     return groupingBy(classifier, HashMap::new, downstream);
11 }
12 // 在第二个方法的基础上再添加了结果Map的生成方法,默认是HashMap。
13 public static <T, K, D, A, M extends Map<K, D>> Collector<T, ?, M> groupingBy(
14             Function<? super T, ? extends K> classifier,
15             Supplier<M> mapFactory,
16             Collector<? super T, A, D> downstream) {
17     Supplier<A> downstreamSupplier = downstream.supplier();
18     BiConsumer<A, ? super T> downstreamAccumulator = downstream.accumulator();
19     BiConsumer<Map<K, A>, T> accumulator = (m, t) -> {
20         K key = Objects.requireNonNull(classifier.apply(t), "element cannot be mapped to a null key");
21         A container = m.computeIfAbsent(key, k -> downstreamSupplier.get());
22         downstreamAccumulator.accept(container, t);
23     };
24     BinaryOperator<Map<K, A>> merger = Collectors.<K, A, Map<K, A>>mapMerger(downstream.combiner());
25     @SuppressWarnings("unchecked")
26     Supplier<Map<K, A>> mangledFactory = (Supplier<Map<K, A>>) mapFactory;
27 
28     if (downstream.characteristics().contains(Collector.Characteristics.IDENTITY_FINISH)) {
29         return new CollectorImpl<>(mangledFactory, accumulator, merger, CH_ID);
30     }
31     else {
32         @SuppressWarnings("unchecked")
33         Function<A, A> downstreamFinisher = (Function<A, A>) downstream.finisher();
34         Function<Map<K, A>, M> finisher = intermediate -> {
35             intermediate.replaceAll((k, v) -> downstreamFinisher.apply(v));
36             @SuppressWarnings("unchecked")
37             M castResult = (M) intermediate;
38             return castResult;
39         };
40         return new CollectorImpl<>(mangledFactory, accumulator, merger, finisher, CH_NOID);
41     }
42 }

实例:

 1 public static void main(String[] args) {
 2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
 3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
 4     Map<String, List<String>> groupByFirst = list.stream().collect(Collectors.groupingBy(e -> e.substring(0, 1)));
 5     System.out.println(groupByFirst);// {1=[123, 100], 2=[228, 250], 3=[345], 5=[521], 8=[838]}
 6     Map<String, Set<String>> groupByLast = list.stream().collect(Collectors.groupingBy(e -> e.substring(e.length() - 1), Collectors.toSet()));
 7     System.out.println(groupByLast);// {0=[100, 250], 1=[521], 3=[123], 5=[345], 8=[228, 838]}
 8     Map<Integer, Set<String>> groupByLength = list.stream().collect(Collectors.groupingBy(String::length, HashMap::new, Collectors.toSet()));
 9     System.out.println(groupByLength);// {3=[100, 123, 521, 345, 228, 838, 250]}
10 }

partitioningBy方法

将流中的元素按照给定的校验规则的结果分为两个部分,放到Map中返回,键是Boolean类型,值为元素的列表List。

方法:

 1 // 只需一个校验参数predicate。
 2 public static <T> Collector<T, ?, Map<Boolean, List<T>>> partitioningBy(Predicate<? super T> predicate) {
 3     return partitioningBy(predicate, toList());
 4 }
 5 // 在上面方法的基础上增加了对流中元素的处理方式的Collector,默认的处理方法就是Collectors.toList()。
 6 public static <T, D, A> Collector<T, ?, Map<Boolean, D>> partitioningBy(Predicate<? super T> predicate,
 7                                                 Collector<? super T, A, D> downstream) {
 8     BiConsumer<A, ? super T> downstreamAccumulator = downstream.accumulator();
 9     BiConsumer<Partition<A>, T> accumulator = (result, t) ->
10             downstreamAccumulator.accept(predicate.test(t) ? result.forTrue : result.forFalse, t);
11     BinaryOperator<A> op = downstream.combiner();
12     BinaryOperator<Partition<A>> merger = (left, right) ->
13             new Partition<>(op.apply(left.forTrue, right.forTrue),
14                             op.apply(left.forFalse, right.forFalse));
15     Supplier<Partition<A>> supplier = () ->
16             new Partition<>(downstream.supplier().get(),
17                             downstream.supplier().get());
18     if (downstream.characteristics().contains(Collector.Characteristics.IDENTITY_FINISH)) {
19         return new CollectorImpl<>(supplier, accumulator, merger, CH_ID);
20     }
21     else {
22         Function<Partition<A>, Map<Boolean, D>> finisher = par ->
23                 new Partition<>(downstream.finisher().apply(par.forTrue),
24                                 downstream.finisher().apply(par.forFalse));
25         return new CollectorImpl<>(supplier, accumulator, merger, finisher, CH_NOID);
26     }
27 }

实例:

1 public static void main(String[] args) {
2     List<String> list = Arrays.asList("123", "521", "100", "228", "838", "250", "345");
3     System.out.println(list);// [123, 521, 100, 228, 838, 250, 345]
4     Map<Boolean, List<String>> moreThan = list.stream().collect(Collectors.partitioningBy(e -> Integer.parseInt(e) > 300));
5     System.out.println(moreThan);// {false=[123, 100, 228, 250], true=[521, 838, 345]}
6     Map<Boolean, Set<String>> lessThan = list.stream().collect(Collectors.partitioningBy(e -> Integer.parseInt(e) < 300, Collectors.toSet()));
7     System.out.println(lessThan);// {false=[521, 345, 838], true=[100, 123, 228, 250]}
8 }

以上是关于JDK8 Stream、Collector 浅析(一)的主要内容,如果未能解决你的问题,请参考以下文章

JDK8对List进行分组操作(stream的groupby)

理解 Java 8 中的 Spliterator、Collector 和 Stream

Java8中重要的收集器Collector

Java8:HashMap<X, Y> 到 HashMap<X, Z> 使用 Stream / Map-Reduce / Collector

java之stream(jdk8)

试水jdk8 stream