面试官：请说一下如何优化结构体的性能？

钜形不锈钢水箱 · 2023-3-7 10:34:16

使用内存对齐机制优化结构体性能，妙啊！

前言

之前分享过2篇结构体文章：
10秒改struct性能直接提升15%，产品姐姐都夸我好棒和 Go语言空结构体这3种妙用，你知道吗？得到了大家的好评。
这篇继续分享进阶内容：
结构体的定义，大家都很熟悉，想要定义出更节省内存空间的结构体，可不是一件简单的事。
我们必须掌握Go的结构体内存对齐机制，才能做出相应的优化：节省内存并提高性能。
先来看个例子

下面定义两个结构体，字段都一样，只是部分字段稍微调整了一下顺序。
但输出的结果却完全不同：一个顺序调整就节省了8个字节，太神奇了。

type BadSt struct {
A int32
B int64
C bool
}
type GoodSt struct {
A int32
C bool
B int64
}
func main() {
bad := BadSt{A: 10, B: 20, C: false}
fmt.Println(unsafe.Sizeof(bad))//输出结果：24
good := GoodSt{A: 10, B: 20, C: false}
fmt.Println(unsafe.Sizeof(good))//输出结果：16
}

复制代码

为什么bad占用24字节，而good却只占用16字节呢？
想要解开这个问题，我们得先来学习一下内存对齐机制，然后再来进一步分析。
原理讲解

基本概念

为了能让CPU可以更快的存储、读取到各个字段，Go编译器会帮我们把结构体做数据的对齐。
所谓的数据对齐，是指内存地址的大小是所存储数据大小的整数倍（按字节为单位），以便CPU可以一次将该数据从内存中读取出来，减少了读取次数。
编译器通过在结构体的各个字段之间填充一些空白，来达到对齐的目的。
CPU访问内存

CPU 访问内存时，并不是逐个字节访问，而是以机器字（word）为单位进行访问。
比如 64位CPU的字长（word size）为8bytes，那么CPU访问内存的单位也是8字节，每次加载的内存数据也是固定的若干字长，如8words（64bytes）、16words(128bytes）等
对齐系数

不同硬件平台占用的大小和对齐值都可能是不一样的，每个特定平台上的编译器都有自己的默认"对齐系数"，32位系统对齐系数是4，64位系统对齐系数是8
不同类型的对齐系数也可能不一样，使用Go语言中的unsafe.Alignof函数可以返回相应类型的对齐系数，对齐系数都符合2^n这个规律，最大也不会超过8

func main() {
fmt.Printf("bool: %d\n", unsafe.Alignof(bool(true)))
fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))
fmt.Printf("int: %d\n", unsafe.Alignof(int(0)))
fmt.Printf("int32: %d\n", unsafe.Alignof(int32(0)))
fmt.Printf("int64: %d\n", unsafe.Alignof(int64(0)))
fmt.Printf("float64: %d\n", unsafe.Alignof(float64(0)))
fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))
}
//输出结果：
//bool: 1
//string: 8
//int: 8
//int32: 4
//int64: 8
//float64:8
//float32:4

复制代码

对齐原则

结构体变量中成员的偏移量必须是成员大小的整数倍
整个结构体的内存大小必须是最大字节的整数倍（结构体的内存占用是1/4/8/16byte…)

案例分析

type BadSt struct {
A int32
B int64
C bool
}

复制代码

BadSt结构体，占用24个字节

分析过程：

字段A 4字节：先计算偏移量，最开头下标为0，0%4=0，正好整除，先占用4个字节；
字段B 8字节：下标4-7，对8都不能整除，则填充空白，下标8可以整除，所以下标8-15 8个字节为字段B的存储使用；
字段C 1字节：下标16，对1可以整除，所以下标16则用作字段C的存储；
最后，该结构体字段最大字节为8且目前已占用17字节，要保证是整数倍，所以最后面需要填充7个字节，占满24字节，才能满足条件（对齐原则2）。

GoodSt结构体，占用16个字节

type GoodSt struct {
A int32
C bool
B int64
}

复制代码

分析过程：

字段A 4字节：先计算偏移量，最开头下标为0，0%4=0，正好整除，先占用4个字节；
字段C 1字节：下标4，对1可以整除，所以下标4则用作字段C的存储；
字段B 8字节：下标5-7，对8都不能整除，则填充空白，下标8可以整除，所以下标8-15 8个字节为字段B的存储使用；
最后，该结构体字段最大字节为8且目前已占用16字节，正好是整数倍，所以后面不再需要填充空白了。

总结

通过上文的原理讲解和案例分析，我们发现内存对齐机制并不复杂。
可以简单理解为：将对齐系数小的字段，尽可能放在一起，尽量减少空白填充。
掌握了内存对齐机制后，结构体Struct的优化，调整下字段顺序，效果立竿见影。内存对齐其实就是典型的空间换时间的方式，来达到优化的目的。牢记对齐原则，对实际场景进行分析，减少空白填充。
原文链接：https://mp.weixin.qq.com/s/64eWxeB0xxA65HZc65axHQ
一起学习

需要简历优化和就业辅导的朋友可以私信我，也欢迎关注我的公众号：
我的文章首发在我的公众号：程序员升职加薪之旅，欢迎大家关注，第一时间阅读我的文章。
也欢迎大家关注我，点赞、留言、转发。你的支持，是我更文的最大动力！

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

		自动登录	找回密码
密码			立即注册

面试官：请说一下如何优化结构体的性能？

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云