我爱普洱茶 发表于 2024-5-17 21:15:04

深度解读《深度探索C++对象模子》之数据成员的存取效率分析(一)

接下来我将持续更新“深度解读《深度探索C++对象模子》”系列,敬请期待,欢迎关注!也可以关注公众号:iShare爱分享,自动获得推文和全部的文章列表。
在《深度解读《深度探索C++对象模子》之C++对象的内存布局》这篇文章中已经详细分析过C++的对象在颠末封装后,在各种情况下的内存布局以及增加的本钱。本文将进一步分析C++对象在封装后,数据成员的存取的实现手段及访问的效率。在这里先抛出一个题目,然后带着题目来一步一步分析,如下面的代码:
class Point {};
Point p;
Point *pp = &p;
p.x = 0;
pp->x = 0;上面的代码中,对数据成员x的存取本钱是什么?通过对象p来存取成员x和通过对象的指针pp来存取成员x的效率存在差异吗?要搞清楚这个题目,得看详细的Point类的定义以及成员x的声明方式。Point类可能是一个独立的类(也就是没有从其他类继承而来),也可能是一个单一继承大概多重继承而来的类,甚至也有可能它的继承父类中有一个是虚拟基类(virtual base class),成员x的声明可能是静态的大概是非静态的。下面的几节将根据差别的情况来一一分析。
类对象的数据成员的存取效率分析系列篇幅比较长,所以根据差别的类的定义分别为几种情形来分析,这篇先来分析静态数据成员的情况。
静态数据成员在编译器里的实现

在前面的文章中说过,类中的静态数据成员是跟类相关的,而非跟详细的对象有关,它存储在对象之外,详细的存储位置是在程序中的数据段中。它实在跟一个全局变量没什么区别,在编译期间编译器就已经确定好了它的存储位置,所以可以或许确定它的地点。看一下下面的代码:
#include <cstdio>

int global_val = 1;

class Base {
public:
    int b1;
    static int s1;
};
int Base::s1 = 1;

int main() {
    static int static_var = 1;
    int local_var = 1;
    Base b;
    printf("&global_val = %p\n", &global_val);
    printf("&static_var = %p\n", &static_var);
    printf("&local_var = %p\n", &local_var);
    printf("&b.b1 = %p\n", &b.b1);
    printf("&b.s1 = %p\n", &b.s1);

    return 0;
}程序输出的结果:
&global_val = 0x102d74000
&static_var = 0x102d74008
&local_var = 0x16d0933f8
&b.b1 = 0x16d0933f4
&b.s1 = 0x102d74004可以看到全局变量global_val和局部静态变量static_var以及类中的静态数据成员s1的地点是顺序且紧密分列在一起的,而且跟其他的两个局部变量的地点相差较大,说明这几个都是一起存储在程序的数据段中的。类中的非静态数据成员b1跟局部变量local_var一样,是存放在栈中的。
可以进一步看看生成的汇编代码,看一下是怎么存取静态数据成员的,下面节选部分的汇编代码:
main:                            # @main
    # 略...
    lea   rdi,
    lea   rsi,
    mov   al, 0
    call    printf@PLT
    lea   rdi,
    lea   rsi,
    mov   al, 0
    call    printf@PLT
        # 略...
    lea   rdi,
    lea   rsi,
    mov   al, 0
    call    printf@PLT
    # 略...
    ret
global_val:
    .long   1      # 0x1

Base::s1:
    .long   1      # 0x1

main::static_var:
    .long   1      # 0x1从汇编代码中看到,global_val、Base::s1和main::static_var是定义在数据段中的,在代码中直接利用它们的地点,如:
lea rsi,
则是将Base::s1的地点加载到rsi寄存器中,作为参数传递给printf函数。这也证明了它跟全局变量,普通的静态变量是没有区别的。结论就是,类中的静态数据成员的存取方式是直接通过一个详细的地点来访问的,跟全局变量毫无区别,所以效率上也跟访问一个全局变量一样。
通过差别方式存取静态数据成员的效率差异

访问类的静态数据成员可以通过类名来访问,如Base::s1,也可以通过对象来访问,如b.s1,甚至是通过指针来访问,如pb->s1。那么这几种访问方式有什么差异?大概说是否有用率上的损失?实在这几种访问方式本质上没有任何差异,编译器会转换成如Base::s1一样的方式,后面的两种方式只是语法上的方便而已,看一下汇编代码就一目了然。把上面的例子多余的代码删除掉,只留下Base类,然后main函数中增加几行打印,如下:
Base b;
Base *pb = &b;
printf("&Base::s1 = %p\n", &Base::s1);
printf("&b.s1 = %p\n", &b.s1);
printf("&pb->s1 = %p\n", &pb->s1);输出的结果固然是同一个地点了,下面是节选的汇编代码:
lea   rdi,
lea   rsi,
mov   al, 0
call    printf@PLT
lea   rdi,
lea   rsi,
mov   al, 0
call    printf@PLT
lea   rdi,
lea   rsi,
mov   al, 0
call    printf@PLT可以看到C++中的几行差别的访问方式在汇编代码中都转换为同样的代码:
lea rsi,
继承而来的静态数据成员的存取分析

我们已经知道类中的静态数据成员是跟对象无关的,所有的对象都共享同一个静态数据成员。但是如果继承而来的静态数据成员又是怎样的呢?如果定义一个Derived类,它是Base类的派生类,那么静态数据成员s1的情况又是如何?实在无论继承多少次,静态数据成员都只有一份,无论是Derived类还是Base类,它们都共享同一个静态数据成员s1,可以通过下面的例子来验证一下:
#include <cstdio>

class Base {
public:
    int b1;
    static int s1;
};
int Base::s1 = 1;

class Derived: public Base {};

int main() {
    Derived d;
    printf("&d.s1 = %p\n", &d.s1);
    printf("d.s1 = %d\n", d.s1);
    d.s1 = 2;

    Base b;
    printf("&b.s1 = %p\n", &b.s1);
    printf("b.s1 = %d\n", b.s1);

    return 0;
}程序输出的结果:
&d.s1 = 0x10028c000
d.s1 = 1
&b.s1 = 0x10028c000
b.s1 = 2可以看到通过Derived类的对象d和Base类的对象b访问到的都是同一个地点,通过对象d修改s1后,通过对象b可以看到修改后的值。
如果您感兴趣这方面的内容,请在微信上搜刮公众号iShare爱分享并关注,以便在内容更新时直接向您推送。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 深度解读《深度探索C++对象模子》之数据成员的存取效率分析(一)