为什么 list.sort() 比 stream().sorted() 要更快?测试结果把我惊呆了! ...

打印 上一主题 下一主题

主题 862|帖子 862|积分 2586

作者:是奉壹呀
来源:juejin.cn/post/7262274383287500860
看到一个评论,里面提到了list.sort()和list.strem().sorted()排序的差异。
说到list sort()排序比stream().sorted()排序性能更好,但没说到为什么。

有朋友也提到了这一点。本文重新开始,先问是不是,再问为什么。
推荐一个开源免费的 Spring Boot 实战项目:
https://github.com/javastacks/spring-boot-best-practice
真的更好吗?

先简单写个demo
  1. List<Integer> userList = new ArrayList<>();
  2.         Random rand = new Random();
  3.         for (int i = 0; i < 10000 ; i++) {
  4.             userList.add(rand.nextInt(1000));
  5.         }
  6.         List<Integer> userList2 = new ArrayList<>();
  7.         userList2.addAll(userList);
  8.         Long startTime1 = System.currentTimeMillis();
  9.         userList2.stream().sorted(Comparator.comparing(Integer::intValue)).collect(Collectors.toList());
  10.         System.out.println("stream.sort耗时:"+(System.currentTimeMillis() - startTime1)+"ms");
  11.         Long startTime = System.currentTimeMillis();
  12.         userList.sort(Comparator.comparing(Integer::intValue));
  13.         System.out.println("List.sort()耗时:"+(System.currentTimeMillis()-startTime)+"ms");
复制代码
输出
  1. stream.sort耗时:62ms
  2. List.sort()耗时:7ms
复制代码
由此可见list原生排序性能更好。
能证明吗?
证据错了。
再把demo变换一下,先输出stream.sort
  1. List<Integer> userList = new ArrayList<>();
  2.         Random rand = new Random();
  3.         for (int i = 0; i < 10000 ; i++) {
  4.             userList.add(rand.nextInt(1000));
  5.         }
  6.         List<Integer> userList2 = new ArrayList<>();
  7.         userList2.addAll(userList);
  8.         Long startTime = System.currentTimeMillis();
  9.         userList.sort(Comparator.comparing(Integer::intValue));
  10.         System.out.println("List.sort()耗时:"+(System.currentTimeMillis()-startTime)+"ms");
  11.         Long startTime1 = System.currentTimeMillis();
  12.         userList2.stream().sorted(Comparator.comparing(Integer::intValue)).collect(Collectors.toList());
  13.         System.out.println("stream.sort耗时:"+(System.currentTimeMillis() - startTime1)+"ms");
复制代码
此时输出变成了
  1. List.sort()耗时:68ms
  2. stream.sort耗时:13ms
复制代码
这能证明上面的结论错误了吗?
都不能。
两种方式都不能证明什么。
使用这种方式在很多场景下是不够的,某些场景下,JVM会对代码进行JIT编译和内联优化。
  1. Long startTime = System.currentTimeMillis();
  2. ...
  3. System.currentTimeMillis() - startTime
复制代码
此时,代码优化前后执行的结果就会非常大。
  1. 基准测试是指通过设计科学的测试方法、测试工具和测试系统,实现对一类测试对象的某项性能指标进行定量的和可对比的测试。
复制代码
基准测试使得被测试代码获得足够预热,让被测试代码得到充分的JIT编译和优化。
下面是通过JMH做一下基准测试,分别测试集合大小在100,10000,100000时两种排序方式的性能差异。
  1. import org.openjdk.jmh.annotations.*;
  2. import org.openjdk.jmh.infra.Blackhole;
  3. import org.openjdk.jmh.results.format.ResultFormatType;
  4. import org.openjdk.jmh.runner.Runner;
  5. import org.openjdk.jmh.runner.RunnerException;
  6. import org.openjdk.jmh.runner.options.Options;
  7. import org.openjdk.jmh.runner.options.OptionsBuilder;
  8. import java.util.*;
  9. import java.util.concurrent.ThreadLocalRandom;
  10. import java.util.concurrent.TimeUnit;
  11. import java.util.stream.Collectors;
  12. @BenchmarkMode(Mode.AverageTime)
  13. @OutputTimeUnit(TimeUnit.MICROSECONDS)
  14. @Warmup(iterations = 2, time = 1)
  15. @Measurement(iterations = 5, time = 5)
  16. @Fork(1)
  17. @State(Scope.Thread)
  18. public class SortBenchmark {
  19.     @Param(value = {"100", "10000", "100000"})
  20.     private int operationSize;
  21.     private static List<Integer> arrayList;
  22.     public static void main(String[] args) throws RunnerException {
  23.         // 启动基准测试
  24.         Options opt = new OptionsBuilder()
  25.                 .include(SortBenchmark.class.getSimpleName())
  26.                 .result("SortBenchmark.json")
  27.                 .mode(Mode.All)
  28.                 .resultFormat(ResultFormatType.JSON)
  29.                 .build();
  30.         new Runner(opt).run();
  31.     }
  32.     @Setup
  33.     public void init() {
  34.         arrayList = new ArrayList<>();
  35.         Random random = new Random();
  36.         for (int i = 0; i < operationSize; i++) {
  37.             arrayList.add(random.nextInt(10000));
  38.         }
  39.     }
  40.     @Benchmark
  41.     public void sort(Blackhole blackhole) {
  42.         arrayList.sort(Comparator.comparing(e -> e));
  43.         blackhole.consume(arrayList);
  44.     }
  45.     @Benchmark
  46.     public void streamSorted(Blackhole blackhole) {
  47.         arrayList = arrayList.stream().sorted(Comparator.comparing(e -> e)).collect(Collectors.toList());
  48.         blackhole.consume(arrayList);
  49.     }
  50. }
复制代码
性能测试结果:

可以看到,list sort()效率确实比stream().sorted()要好。
为什么更好?

流本身的损耗

java的stream让我们可以在应用层就可以高效地实现类似数据库SQL的聚合操作了,它可以让代码更加简洁优雅。
但是,假设我们要对一个list排序,得先把list转成stream流,排序完成后需要将数据收集起来重新形成list,这部份额外的开销有多大呢?
我们可以通过以下代码来进行基准测试
  1. import org.openjdk.jmh.annotations.*;
  2. import org.openjdk.jmh.infra.Blackhole;
  3. import org.openjdk.jmh.results.format.ResultFormatType;
  4. import org.openjdk.jmh.runner.Runner;
  5. import org.openjdk.jmh.runner.RunnerException;
  6. import org.openjdk.jmh.runner.options.Options;
  7. import org.openjdk.jmh.runner.options.OptionsBuilder;
  8. import java.util.ArrayList;
  9. import java.util.Comparator;
  10. import java.util.List;
  11. import java.util.Random;
  12. import java.util.concurrent.TimeUnit;
  13. import java.util.stream.Collectors;
  14. @BenchmarkMode(Mode.AverageTime)
  15. @OutputTimeUnit(TimeUnit.MICROSECONDS)
  16. @Warmup(iterations = 2, time = 1)
  17. @Measurement(iterations = 5, time = 5)
  18. @Fork(1)
  19. @State(Scope.Thread)
  20. public class SortBenchmark3 {
  21.     @Param(value = {"100", "10000"})
  22.     private int operationSize; // 操作次数
  23.     private static List<Integer> arrayList;
  24.     public static void main(String[] args) throws RunnerException {
  25.         // 启动基准测试
  26.         Options opt = new OptionsBuilder()
  27.                 .include(SortBenchmark3.class.getSimpleName()) // 要导入的测试类
  28.                 .result("SortBenchmark3.json")
  29.                 .mode(Mode.All)
  30.                 .resultFormat(ResultFormatType.JSON)
  31.                 .build();
  32.         new Runner(opt).run(); // 执行测试
  33.     }
  34.     @Setup
  35.     public void init() {
  36.         // 启动执行事件
  37.         arrayList = new ArrayList<>();
  38.         Random random = new Random();
  39.         for (int i = 0; i < operationSize; i++) {
  40.             arrayList.add(random.nextInt(10000));
  41.         }
  42.     }
  43.     @Benchmark
  44.     public void stream(Blackhole blackhole) {
  45.         arrayList.stream().collect(Collectors.toList());
  46.         blackhole.consume(arrayList);
  47.     }
  48.     @Benchmark
  49.     public void sort(Blackhole blackhole) {
  50.         arrayList.stream().sorted(Comparator.comparing(Integer::intValue)).collect(Collectors.toList());
  51.         blackhole.consume(arrayList);
  52.     }
  53. }
复制代码
方法stream测试将一个集合转为流再收集回来的耗时。
方法sort测试将一个集合转为流再排序再收集回来的全过程耗时。
测试结果如下:

可以发现,集合转为流再收集回来的过程,肯定会耗时,但是它占全过程的比率并不算高。
因此,这部只能说是小部份的原因。
排序过程

我们可以通过以下源码很直观的看到。


  • 1 begin方法初始化一个数组。
  • 2 accept 接收上游数据。
  • 3 end 方法开始进行排序。
这里第3步直接调用了原生的排序方法,完成排序后,第4步,遍历向下游发送数据。
所以通过源码,我们也能很明显地看到,stream()排序所需时间肯定是 > 原生排序时间。
只不过,这里要量化地搞明白,到底多出了多少,这里得去编译jdk源码,在第3步前后将时间打印出来。
这一步我就不做了。
感兴趣的朋友可以去测一下。
不过我觉得这两点也能很好地回答,为什么list.sort()比Stream().sorted()更快。
补充说明:
1、 本文说的stream()流指的是串行流,而不是并行流;
2、 绝大多数场景下,几百几千几万的数据,开心就好,怎么方便怎么用,没有必要去计较这点性能差异;
近期热文推荐:
1.1,000+ 道 Java面试题及答案整理(2022最新版)
2.劲爆!Java 协程要来了。。。
3.Spring Boot 2.x 教程,太全了!
4.别再写满屏的爆爆爆炸类了,试试装饰器模式,这才是优雅的方式!!
5.《Java开发手册(嵩山版)》最新发布,速速下载!
觉得不错,别忘了随手点赞+转发哦!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

宝塔山

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表