Java8 函数式编程stream流

打印 上一主题 下一主题

主题 904|帖子 904|积分 2712

开篇介绍

Java 8 中新增的特性旨在帮助程序员写出更好的代码,其中对核心类库的改进是很关键的一部分,也是本章的主要内容。对核心类库的改进主要包括集合类的 API 和新引入的流(Stream),流使程序员得以站在更高的抽象层次上对集合进行操作。下面将介绍stream流的用法。
1.初始环境准备

​                场景:现在有一个公司,公司部门有一级部门,二级部门甲和二级部门乙(其中二级部门甲和二级部门乙是一级部门的子部门),
一级部门下面有有001号员工小明,二级部门甲下面有002号员工小刚和003号员工小李,二级部门乙有002号员工小刚和004号员工小张,其中员工id是唯一的,员工小刚既是二级部门甲又是二级部门乙的员工。代码展示如下:
  1. public class LambdaUseCase {
  2.     static List<Department> departmentList;
  3.     static {
  4.         // 一级部门,部门人员有001号员工小明
  5.         Department departmentOne = new Department("一级部门", 1,10000L,11000L,
  6.                 Arrays.asList(new Person("001","小明",22)));
  7.         // 二级部门甲,部门人员有002号员工小刚和003号员工小李
  8.         Department departmentTwoFirst = new Department("二级部门甲", 2,8000L,13000L,
  9.                 Arrays.asList(new Person("002","小刚",23),
  10.                         new Person("003","小李",32)));
  11.         // 二级部门乙,部门人员有002号员工小刚和004号员工小张
  12.         Department departmentTwoSecond = new Department("二级部门已", 2,7500L,15000L,
  13.                 Arrays.asList(new Person("002","小刚",23),
  14.                         new Person("004","小张",34)));
  15.         departmentList = Arrays.asList(departmentOne,departmentTwoFirst,departmentTwoSecond);
  16.     }
  17. }
  18. @Data
  19. @AllArgsConstructor
  20. @NoArgsConstructor
  21. class Department {
  22.     // 部门名
  23.     private String departmentName;
  24.     // 部门等级
  25.     private Integer departmenRank;
  26.     // 部门薪资(单位分)
  27.     private Long departSalary;
  28.     // 部门日盈利
  29.     private Long departProfit;
  30.     // 部门人员集合
  31.     private List<Person> persons;
  32. }
  33. @Data
  34. @AllArgsConstructor
  35. @NoArgsConstructor
  36. //重写equal和hashcode方法,用于数据去重
  37. @EqualsAndHashCode
  38. class Person {
  39.     // 人员id
  40.     private String personId;
  41.     // 人员姓名
  42.     private String personName;
  43.     // 人员年龄
  44.     private Integer personAge;
  45. }
复制代码
2.创建流

单列集合: 集合对象.stream() 创建流
  1. departmentList.stream();
复制代码
数组:Arrays.stream(数组) 或者使用Stream.of来创建
  1. Integer[] arr = {1,2,3,4,5};
  2. Stream<Integer> stream = Arrays.stream(arr);
  3. Stream<Integer> stream2 = Stream.of(arr);
  4. Stream.of(1,2,3,4);
复制代码
双列集合:转换成单列集合后再创建
  1. Map<String, Integer> map = new HashMap<>();
  2. map.put("a", 1);
  3. map.put("b", 2);
  4. map.put("c", 3);
  5. Stream<Map.Entry<String, Integer>> stream = map.entrySet().stream();
复制代码
3.中间操作

3.1 map

如果有一个函数可以将一种类型的值转换成另外一种类型,map 操作就可以使用该函数,将一个流中的值转换成一个新的流
需求:公司今年收益提供,决定把所有部门的平均薪资提升1000。
  1. List<Department> departments = departmentList.stream().map(e -> {
  2.     e.setDepartSalary(e.getDepartSalary() + 1000);
  3.     return e;
  4. }).collect(Collectors.toList());
复制代码
3.2 filter

对流中的元素进行过滤,筛选出符合过滤条件的数据
需求:需要筛选出部门平均薪资大于等于8000的数据。
  1. List<Department> departments = departmentList.stream()
  2.                 .filter(e -> e.getDepartSalary() >= 8000)
  3.                 .collect(Collectors.toList());
复制代码
3.3 flatMap

flatMap 方法可用 Stream 替换值,然后将多个 Stream 连接成一个 Stream
需求:把公司所有的人员收集到一个集合中。
不使用flatMap,你可能会这么做,循环里套循环,看上去不太美观。
  1. Set<Person> personSet = new HashSet<>();
  2. departmentList.stream().forEach(e->{
  3.         e.getPersons().stream().forEach(person->{
  4.                 personSet.add(person);
  5.         });
  6. });
复制代码
使用flatMap写法。
  1. Set<Person> personSet = departmentList.stream()
  2.         .flatMap(e -> e.getPersons().stream())
  3.         .collect(Collectors.toSet());
复制代码
3.4 distinct

去除流中的重复元素
需求:将公司所有的人员统计出来,这回不使用Set去重,注意:002号员工即在二级部门甲又在二级部门乙
  1. List<Person> personSet = departmentList.stream()
  2.         .flatMap(e -> e.getPersons().stream())
  3.         .distinct()
  4.         .collect(Collectors.toList());
复制代码
注意:distinct方法是依赖Object的equals方法来判断是否是相同对象的。所以需要注意重写equals方法。
3.5 sorted

对流中的元素进行排序
需求: 按薪资从低到高将部门列出来。
  1. List<Department> departments = departmentList.stream()
  2.         .sorted((o1, o2) -> o1.getDepartSalary().compareTo(o2.getDepartSalary()))
  3.         .collect(Collectors.toList());
复制代码
注意:如果调用空参的sorted()方法,需要流中的元素是实现了Comparable。
3.6 limit

可以设置流的最大长度,超出的部分将被抛弃
需求:按薪资从低到高将部门列出来,并且找出薪资最低的俩个部门
  1. List<Department> departments = departmentList.stream()
  2.                 .sorted(Comparator.comparing(Department::getDepartSalary))
  3.                 .limit(2)
  4.                 .collect(Collectors.toList());
复制代码
3.7 skip

跳过流中的前n个元素,返回剩下的元素
需求:按薪资从低到高将部门列出来,并且忽略薪资最低的部门
  1. List<Department> departments = departmentList.stream()
  2.                 .sorted(Comparator.comparing(Department::getDepartSalary))
  3.                 .skip(1)
  4.                 .collect(Collectors.toList());
复制代码
4.终结操作

4.1 foreach

对流中的元素进行遍历操作
需求:要求输出全部部门的名称
  1. departmentList.stream()
  2.                 .forEach(e -> System.out.println(e.getDepartmentName()));
复制代码
4.2 count

可以用来获取当前流中元素的个数。
需求:统计部门的格式
  1. long count = departmentList.stream()
  2.     .count();
复制代码
4.3 max和min

Stream 上常用的操作之一是求最大值和最小值
需求:分别找出部门里面薪资最高的部门和最低的部门
  1. Department maxDepartment = departmentList.stream()
  2.                 .max(Comparator.comparing(Department::getDepartSalary))
  3.                 .get();
  4. Department minDepartment = departmentList.stream()
  5.                 .min(Comparator.comparing(Department::getDepartSalary))
  6.                 .get();
复制代码
4.4 collect

将当前的流转换为一个集合
4.4.1 Collectors.toList()

需求:获得一个保存所有部门名字的集合
  1. List<String> departNameList = departmentList.stream()
  2.                 .map(Department::getDepartmentName)
  3.                 .collect(Collectors.toList());
复制代码
4.4.2 Collectors.toSet()

需求:获得部门所有人的姓名(重名的忽略)
  1. Set<String> personNameList = departmentList.stream()
  2.                 .flatMap(e -> e.getPersons().stream())
  3.                 .map(Person::getPersonName)
  4.         .collect(Collectors.toSet());
复制代码
4.4.3 Collectors.toMap(keyMapper, valueMapper)

需求:获得部门名称当做key,员工当做value的Map
  1. Map<String, List<Person>> collect = departmentList.stream()
  2.                 .collect(Collectors.toMap(Department::getDepartmentName, Department::getPersons));
复制代码
4.4.4 Collectors.joining()

需求:将所有的部门名字连起来,并且前缀是【,后缀是】,分隔符是,
  1. departmentList.stream()
  2.                 .map(Department::getDepartmentName)
  3.                 .collect(Collectors.joining(",","[","]"));
复制代码
4.4.5 Collectors.partitioningBy(predicate)

接受一个流,并将其分成两部分,使用 Predicate 对象判断一个元素应该属于哪个部分,并根据布尔值返回一个 Map 到列表。
需求:将一级部门和其他级别的部门分离出来
  1. Map<Boolean, List<Department>> collect = departmentList
  2.     .stream()
  3.     .collect(Collectors.partitioningBy(e -> e.getDepartmenRank() == 1));
复制代码
4.4.6 Collectors.groupingBy(classifier)

接受一个分类函数,用来对数据分组
需求:将部门按部门的阶级分组
  1. Map<Integer, List<Department>> collect = departmentList
  2.     .stream()
  3.     .collect(Collectors.groupingBy(Department::getDepartmenRank));
复制代码
4.4.7 组合收集器

各种收集器已经很强大了,但如果将它们组合起来,会变得更强大。
需求:统计各个阶级部门的平均薪资
  1. Map<Integer, Double> collect = departmentList.stream()
  2. .collect(Collectors.groupingBy(Department::getDepartmenRank,Collectors.averagingLong(Department::getDepartSalary)));
复制代码
这个例子中用到了第二个收集器,用以收集最终结果的一个子集。这些收集器叫作下游收集器。收集器是生成最终结果的一剂配方,下游收集器则是生成部分结果的配方,主收集器中会用到下游收集器。这种组合使用收集器的方式,使得它们在 Stream 类库中的作用更加强大。
4.5 reduce

对流中的数据按照指定的方式计算出结果
需求:计算出部门总的日盈利
  1. Long sum = departmentList.stream()
  2.                 .map(Department::getDepartProfit)
  3.                 .reduce(0L, (result, element) -> result + element);
复制代码
4.6 anyMatch

可以用来判断是否有任意符合匹配条件的元素,结果为boolean类型。
需求:判断部门中有没有薪资大于9000的部门
  1. boolean b = departmentList.stream()
  2.                 .anyMatch(e -> e.getDepartSalary() > 9000L);
复制代码
4.7 allMatch

可以用来判断是否都符合匹配条件,结果为boolean类型。如果都符合结果为true,否则结果为false。
需求:判断部门薪资是不是都大于9000
  1. boolean b = departmentList.stream()
  2.                 .allMatch(e -> e.getDepartSalary() > 9000L);
复制代码
4.8 noneMatch

可以判断流中的元素是否都不符合匹配条件。如果都不符合结果为true,否则结果为false
需求:判断是不是所有的部门薪资都大于9000
  1. boolean b = departmentList.stream()
  2.                 .noneMatch(e -> e.getDepartSalary() > 9000L);
复制代码
4.9 findAny

获取流中的任意一个元素。该方法没有办法保证获取的一定是流中的第一个元素。
需求:找到任意一个部门
  1. Department department = departmentList
  2.                 .stream()
  3.                 .findAny()
  4.                 .get();
复制代码
4.10 findFirst

获取流中的第一个元素。
需求:获得薪资最低的一个部门
  1. Department department = departmentList
  2.                 .stream()
  3.                 .sorted(Comparator.comparing(Department::getDepartSalary))
  4.                 .findFirst()
  5.                 .get();
复制代码
5.高级用法

5.1 对基本类型处理(mapToInt,mapToLong,mapToDouble)

在 Java 中,有一些相伴的类型,比如 int 和 Integer——前者是基本类型,后者是装箱类型。基本类型内建在语言和运行环境中,是基本的程序构建模块;而装箱类型属于普通的 Java 类,只不过是对基本类型的一种封装。由于装箱类型是对象,因此在内存中存在额外开销。比如,整型在内存中占用4 字节,整型对象却要占用 16 字节。这一情况在数组上更加严重,整型数组中的每个元素只占用基本类型的内存,而整型对象数组中,每个元素都是内存中的一个指针,指向 Java堆中的某个对象。在最坏的情况下,同样大小的数组,Integer[] 要比 int[] 多占用 6 倍内存。
将基本类型转换为装箱类型,称为装箱,反之则称为拆箱,两者都需要额外的计算开销。对于需要大量数值运算的算法来说,装箱和拆箱的计算开销,以及装箱类型占用的额外内存,会明显减缓程序的运行速度。
为了减小这些性能开销,Stream 类的某些方法对基本类型和装箱类型做了区分。高阶函数 mapToLong 和其他类似函数即为该方面的一个尝试。在 Java 8 中,仅对整型、长整型和双浮点型做了特殊处理,因为它们在数值计算中用得最多,特殊处理后的系统性能提升效果最明显。
如有可能,应尽可能多地使用对基本类型做过特殊处理的方法,进而改善性能。这些特殊的 Stream 还提供额外的方法,避免重复实现一些通用的方法,让代码更能体现出数值计算的意图。
需求:需要计算出公司部门利润的平均值,最大值,最小值,以及利润总和。
  1. LongSummaryStatistics longSummaryStatistics = departmentList
  2.     .stream()
  3.     .mapToLong(Department::getDepartProfit)
  4.     .summaryStatistics();
  5. System.out.println("利润最大值"+longSummaryStatistics.getMax());
  6. System.out.println("利润最小值"+longSummaryStatistics.getMin());
  7. System.out.println("利润平均值"+longSummaryStatistics.getAverage());
  8. System.out.println("利润总和"+longSummaryStatistics.getSum());
复制代码
这些统计值在所有特殊处理的 Stream,如 DoubleStream、LongStream 中都可以得出。如无需全部的统计值,也可分别调用 min、max、average 或 sum 方法获得单个的统计值,同样,三种基本类型对应的特殊 Stream 也都包含这些方法。
6. 数据并行化

并 行 化 操 作 流 只 需 改 变 一 个 方 法 调 用。 如 果 已 经 有 一 个 Stream 对 象, 调 用 它 的parallel 方法就能让其拥有并行操作的能力。如果想从一个集合类创建一个流,调用parallelStream 就能立即获得一个拥有并行能力的流。
需求:并行的统计公司的所有的人员。
  1. Set<Person> collect = departmentList.stream()
  2.                 .parallel()
  3.                 .flatMap(e -> e.getPersons().stream()).collect(Collectors.toSet());
  4. Set<Person> collect1 = departmentList.parallelStream()
  5.                 .flatMap(e -> e.getPersons().stream()).collect(Collectors.toSet());
复制代码
在底层,并行流还是沿用了 fork/join 框架。fork 递归式地分解问题,然后每段并行执行,最终由 join 合并结果,返回最后的值。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

怀念夏天

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表