ToB企服应用市场:ToB评测及商务社交产业平台

标题: 面试官:请说一下如何优化结构体的性能? [打印本页]

作者: 钜形不锈钢水箱    时间: 2023-3-7 10:34
标题: 面试官:请说一下如何优化结构体的性能?
使用内存对齐机制优化结构体性能,妙啊!
前言

之前分享过2篇结构体文章:
10秒改struct性能直接提升15%,产品姐姐都夸我好棒Go语言空结构体这3种妙用,你知道吗? 得到了大家的好评。
这篇继续分享进阶内容:
结构体的定义,大家都很熟悉,想要定义出更节省内存空间的结构体,可不是一件简单的事。
我们必须掌握Go的结构体内存对齐机制,才能做出相应的优化:节省内存并提高性能。
先来看个例子

下面定义两个结构体,字段都一样,只是部分字段稍微调整了一下顺序。
但输出的结果却完全不同:一个顺序调整就节省了8个字节,太神奇了。
  1. type BadSt struct {
  2.   A int32
  3.   B int64
  4.   C bool
  5. }
  6. type GoodSt struct {
  7.   A int32
  8.   C bool
  9.   B int64
  10. }
  11. func main() {
  12.   bad := BadSt{A: 10, B: 20, C: false}
  13.   fmt.Println(unsafe.Sizeof(bad))//输出结果:24
  14.   good := GoodSt{A: 10, B: 20, C: false}
  15.   fmt.Println(unsafe.Sizeof(good))//输出结果:16
  16. }
复制代码
为什么bad占用24字节,而good却只占用16字节呢
想要解开这个问题,我们得先来学习一下内存对齐机制,然后再来进一步分析。
原理讲解

基本概念

为了能让CPU可以更快的存储、读取到各个字段,Go编译器会帮我们把结构体做数据的对齐。
所谓的数据对齐,是指内存地址的大小是所存储数据大小的整数倍(按字节为单位),以便CPU可以一次将该数据从内存中读取出来,减少了读取次数。
编译器通过在结构体的各个字段之间填充一些空白,来达到对齐的目的
CPU访问内存

CPU 访问内存时,并不是逐个字节访问,而是以机器字(word)为单位进行访问
比如 64位CPU的字长(word size)为8bytes,那么CPU访问内存的单位也是8字节,每次加载的内存数据也是固定的若干字长,如8words(64bytes)、16words(128bytes)等
对齐系数

不同硬件平台占用的大小和对齐值都可能是不一样的,每个特定平台上的编译器都有自己的默认"对齐系数",32位系统对齐系数是4,64位系统对齐系数是8
不同类型的对齐系数也可能不一样,使用Go语言中的unsafe.Alignof函数可以返回相应类型的对齐系数,对齐系数都符合2^n这个规律,最大也不会超过8
  1. func main() {
  2.   fmt.Printf("bool:   %d\n", unsafe.Alignof(bool(true)))
  3.   fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))
  4.   fmt.Printf("int:    %d\n", unsafe.Alignof(int(0)))
  5.   fmt.Printf("int32:  %d\n", unsafe.Alignof(int32(0)))
  6.   fmt.Printf("int64:  %d\n", unsafe.Alignof(int64(0)))
  7.   fmt.Printf("float64:  %d\n", unsafe.Alignof(float64(0)))
  8.   fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))
  9. }
  10. //输出结果:
  11. //bool:   1
  12. //string: 8
  13. //int:    8
  14. //int32:  4
  15. //int64:  8
  16. //float64:8
  17. //float32:4
复制代码
对齐原则

案例分析
  1. type BadSt struct {
  2.   A int32
  3.   B int64
  4.   C bool
  5. }
复制代码
BadSt结构体,占用24个字节


分析过程:
GoodSt结构体,占用16个字节

  1. type GoodSt struct {
  2.   A int32
  3.   C bool
  4.   B int64
  5. }
复制代码
分析过程:
总结

通过上文的原理讲解和案例分析,我们发现内存对齐机制并不复杂。
可以简单理解为:将对齐系数小的字段,尽可能放在一起,尽量减少空白填充。
掌握了内存对齐机制后,结构体Struct的优化,调整下字段顺序,效果立竿见影。内存对齐其实就是典型的空间换时间的方式,来达到优化的目的。牢记对齐原则,对实际场景进行分析,减少空白填充
原文链接:https://mp.weixin.qq.com/s/64eWxeB0xxA65HZc65axHQ
一起学习

需要简历优化和就业辅导的朋友可以私信我,也欢迎关注我的公众号:
我的文章首发在我的公众号: 程序员升职加薪之旅,欢迎大家关注,第一时间阅读我的文章。
也欢迎大家关注我,点赞、留言、转发。你的支持,是我更文的最大动力!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4