Go语言基准测试(benchmark)三部曲之二:内存篇

打印 上一主题 下一主题

主题 895|帖子 895|积分 2685

欢迎访问我的GitHub

这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos
本篇概览


  • 本文是《Go语言基准测试(benchmark)三部曲》的第二篇,目标是掌握如何用基准测试来观察被测方法的内存分配情况
  • 今天除了常规的操作,即指定参数增加内存相关的测试结果,咱们还要针对内存分配问题增加几个方法用于对比验证,最终达到根据基准测试发现内存问题的目标
基本操作


  • 查看方法中的内存使用情况,请在原来的benchmark测试命令中增加-benchmem参数,完整命令如下,用的是前文的BenchmarkFib和BenchmarkParallelFib方法做基准测试
  1. go test -bench='Fib$' -benchmem .
复制代码

  • 测试结果如下,竟然没有使用内存,不过想想也是,fib方法主要是斐波那契数列计算,未涉及到内存分配,看来这个例子不具有说明性,咱们需要写两个涉及到内存分配的方法,再对他们做基准测试看看效果

新增两个方法用于基准测试


  • 为了展现内存分配的不同程度影响,这里会编写两个方法用于对比测试
  • 这两个方法的功能是一样的:产生N个随机数(N是方法的入参),然后放入切片中
  • 虽然功能一样,但是这两个方法最大的不同就是:名为newSlice的方法,创建切片的时候没有指定切片容量,另一个名为newSliceWithCap的方法在创建切片的时候指定了切片容量
  • newSlice和newSliceWithCap方法的源码如下,都在main.go中
  1. // 往切片中放入指定数量的随机数,这个切片没有提前设置容量
  2. func newSlice(n int) []int {
  3.         rand.Seed(time.Now().UnixNano())
  4.         // 注意,这里在生成切片的时候并没有指定容量
  5.         nums := make([]int, 0)
  6.         for i := 0; i < n; i++ {
  7.                 nums = append(nums, rand.Int())
  8.         }
  9.         return nums
  10. }
  11. // 往切片中放入指定数量的随机数,这个切片提前设置了容量
  12. func newSliceWithCap(n int) []int {
  13.         rand.Seed(time.Now().UnixNano())
  14.         // 注意,这里在生成切片的时候指定了容量
  15.         nums := make([]int, 0, n)
  16.         for i := 0; i < n; i++ {
  17.                 nums = append(nums, rand.Int())
  18.         }
  19.         return nums
  20. }
复制代码

  • 接下来在main_test.go文件中增加基准测试的代码,先准备三个常量,后面会用到
  1. const (
  2.         SLICE_LENGTH_MILLION         = 1000000   // 往切片中添加数据的长度,百万
  3.         SLICE_LENGTH_TEN_MILLION     = 10000000  // 往切片中添加数据的长度,千万
  4.         SLICE_LENGTH_HUNDRED_MILLION = 100000000 // 往切片中添加数据的长度,亿
  5. )
复制代码

  • 然后是两个基准测试的方法,分别用于测试newSlicenewSliceWithCap
  1. func BenchmarkNewSlice(b *testing.B) {
  2.         for n := 0; n < b.N; n++ {
  3.                 newSlice(SLICE_LENGTH_MILLION)
  4.         }
  5. }
  6. func BenchmarkNewSliceWithCap(b *testing.B) {
  7.         for n := 0; n < b.N; n++ {
  8.                 newSliceWithCap(SLICE_LENGTH_MILLION)
  9.         }
  10. }
复制代码

  • 代码写完了,从理论上分析,切片未指定容量,就会随着内容的增加发生新的内存分配,因此newSlice的内存使用和内存分配都应该超过newSliceWithCap,咱们来测试一下,看数据和推论是否匹配
  • 执行以下命令,正则表达式的意思是只执行BenchmarkNewSliceBenchmarkNewSliceWithCap这两个方法
  1. go test -bench='BenchmarkNewSlice$|BenchmarkNewSliceWithCap$' -benchmem .
复制代码

  • 结果如下,可见未指定容量的切片在保存数据时会触发扩容,会分配更多内存,内存分配次数也会跟多,每次方法执行的耗时也更多,而提前指定了容量的切片,中途不再发生扩容,内存分配量更小,方法执行耗时也更少(对我们的开发还是有指导意义的)
  1. go test -bench='BenchmarkNewSlice$|BenchmarkNewSliceWithCap$' -benchmem .
  2. goos: darwin
  3. goarch: arm64
  4. pkg: benchmark-demo
  5. BenchmarkNewSlice-8          68  16568869 ns/op 41678153 B/op  38 allocs/op
  6. BenchmarkNewSliceWithCap-8   84  14098503 ns/op  8003589 B/op   1 allocs/op
  7. PASS
  8. ok      benchmark-demo  2.769s
复制代码
同一方法的不同数量级对比


  • 经过前面的测试,可以确定newSliceWithCap方法由于未指定切片容量,在保存数据的中途会触发扩容,从而导致内存分配的大小和次数都会增加
  • 这个结果是对比newSlice方法得出的,此方法指定了切片容量的,接下里咱们换种测试方式:让newSliceWithCap内的切片分别存入不同数量级的数据,观察此方法在面对这些数据时的内存分配情况
  • 在main_test.go中增加一个方法
  1. func testNewSlice(len int, b *testing.B) {
  2.         for n := 0; n < b.N; n++ {
  3.                 newSlice(len)
  4.         }
  5. }
复制代码

  • 现在只要新增多个BenchmarkXXX方法,每个方法都调用testNewSlice并传入不同数量级的数字,就能实现对比测试了,详细代码如下,咱们分解测试百万、千万、亿这三个级别的数据量下newSlice的内存分配情况
  1. func BenchmarkNewSlicMillion(b *testing.B) {
  2.         testNewSlice(SLICE_LENGTH_MILLION, b)
  3. }
  4. func BenchmarkNewSlicTenMillion(b *testing.B) {
  5.         testNewSlice(SLICE_LENGTH_TEN_MILLION, b)
  6. }
  7. func BenchmarkNewSlicHundredMillion(b *testing.B) {
  8.         testNewSlice(SLICE_LENGTH_HUNDRED_MILLION, b)
  9. }
复制代码

  • 执行以下命令测试,只会匹配到上面新增的三个测试方法
  1. go test -bench='Million$' -benchmem .
复制代码

  • 同一方法,处理不同数量级内容的对比测试结果如下,可见不指定容量的切片存入数据时,数据量越大,对性能的影响越严重
  1. go test -bench='Million$' -benchmem .
  2. goos: darwin
  3. goarch: arm64
  4. pkg: benchmark-demo
  5. BenchmarkNewSlicMillion-8         67    16283754 ns/op  41678145 B/op    38 allocs/op
  6. BenchmarkNewSlicTenMillion-8       7   159938941 ns/op  492000525 B/op   49 allocs/op
  7. BenchmarkNewSlicHundredMillion-8   1  2242365417 ns/op  4589008224 B/op  60 allocs/op
复制代码

  • 至此,基准测试的内存篇就完成了,相信大家对benchmark的基本功能已经掌握,接下来的《提高篇》会有更多进阶内容,协助咱们完成更加全面精确的基准测试,敬请期待,欣宸原创,必不让您失望
欢迎关注博客园:程序员欣宸

学习路上,你不孤单,欣宸原创一路相伴...

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

天空闲话

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表