张国伟 发表于 2024-9-24 18:19:26

CSAPP程序人生-盘算机体系大作业

摘  要
为了探究一个程序在盘算机的生命历程,本文联合著作CSAPP以及相关知识,以简单的hello.c为例,详细论述了关于hello.c这一程序经历预处理(cpp)、编译(ccl)、汇编(as)从而酿成可实行文件的过程;接着细致睁开说明白此可实行文件是如何从shell(壳)中生成、通过fork、exeve生成子进程,再到体系通过映射为它分配存储空间、举行I/O管理。本文通过模仿hello.c在盘算机中的一生,展示了程序在盘算机中的紧密关系以及底层的处理方式,彰显了盘算机体系独有的魅力。

关键词:盘算机体系,汇编,链接,进程,I/O管理                    









目  录

第1章 概述
1.1 Hello简介
1.2 环境与工具
1.3 中心结果
1.4 本章小结
第2章 预处理
2.1 预处理的概念与作用
2.2在Ubuntu下预处理的命令
2.3 Hello的预处理结果剖析
2.4 本章小结
第3章 编译
3.1 编译的概念与作用
3.2 在Ubuntu下编译的命令
3.3 Hello的编译结果剖析
3.4 本章小结
第4章 汇编
4.1 汇编的概念与作用
4.2 在Ubuntu下汇编的命令
4.3 可重定位目的elf格式
4.4 Hello.o的结果剖析
4.5 本章小结
第5章 链接
5.1 链接的概念与作用
5.2 在Ubuntu下链接的命令
5.3 可实行目的文件hello的格式
5.4 hello的假造地点空间
5.5 链接的重定位过程分析
5.6 hello的实行流程
5.7 Hello的动态链接分析
5.8 本章小结
第6章 hello进程管理
6.1 进程的概念与作用
6.2 简述壳Shell-bash的作用与处理流程
6.3 Hello的fork进程创建过程
6.4 Hello的execve过程
6.5 Hello的进程实行
6.6 hello的非常与信号处理
6.7本章小结
第7章 hello的存储管理
7.1 hello的存储器地点空间
7.2 Intel逻辑地点到线性地点的变更-段式管理
7.3 Hello的线性地点到物理地点的变更-页式管理
7.4 TLB与四级页表支持下的VA到PA的变更
7.5 三级Cache支持下的物理内存访问
7.6 hello进程fork时的内存映射
7.7 hello进程execve时的内存映射
7.8 缺页故障与缺页中断处理
7.9动态存储分配管理
7.10本章小结
第8章 hello的IO管理
8.1 Linux的IO设备管理方法
8.2 简述Unix IO接口及其函数
8.3 printf的实现分析
8.4 getchar的实现分析
8.5本章小结
结论
附件
参考文献


第1章 概述

1.1 Hello简介


https://i-blog.csdnimg.cn/blog_migrate/6201f1e2ee0cbcf9455f9ebc74778f98.png 图 1.1.1 hello原程序
hello.c是一个已经编写好的的程序,可以看到它能举行命令行参数的输入,并且打印相关字符串等,我们要实现的即是hello的两个过程:P2P以及020。
P2P:Program to Process
这一过程将形貌为hello是如何从一个程序转变为一个进程的。首先hello.c创建好后,会经过预处理器(cpp)对原文件中的#include、#define、#ifdef等举行内容插入、宏替换、条件编译等,同时删除相关解释,生成.i文件;接着会经过编译器(ccl)将.i文件生成汇编语言文件.s文件,再通过汇编器(as)生成一个二进制的可重定位目的文件,将其保存在一个.o文件中;通过链接举行符号剖析、库链接、重定位等,终极生成一个可实行文件hello;最后用户在shell中输入./hello,由shell剖析用户输入命令,再由使用体系(OS)调用fork函数创建一个新的子进程并调用execve函数将hello加载到该子进程的地点空间中,这样hello便成为了进程。
https://i-blog.csdnimg.cn/blog_migrate/72158d3e4c6e50dfe549aa0714382b36.png



图 1.1.2 生成可实行文件的步骤
020:Zreo-0 to Zreo-0
020形貌了hello的一生。在经过P2P后,hello已经在进程中运行,当实行到return后看似hello已经结束,其实它酿成了一个僵死进程,此时父进程会收到它正常终止的状态信号(经过调用waitpid函数捕获到其终止信号后),使用体系将终极开释该进程所占的一系列资源,此刻hello干净地结束了它的一生,不带走一片云彩~
1.2 环境与工具

硬件环境:AMD Ryzen 7 5800H CPU;16GB;RTX 3060
软件环境:Windows 10 64位;Vmware 16.2.4;Ubuntu 18.04.6 64位
开辟工具:CodeBlocks 64位;vim+gcc,edb,gdb,objdump等
1.3 中心结果

hello.c
程序原文件
hello.i
预处理(cpp)后生成的文件
hello.s
编译(ccl)后生成的汇编文件
hello.o
汇编(as)后生成的可重定位目的文件
hello
链接后生成的可实行文件
hello.asm
hello.o文件经过objdump生成的反汇编文件
hello.elf
hello.o文件生成的elf文件
Hello.asm
hello文件经过objdump生成的反汇编文件
Hello.elf
hello文件生成的elf文件
表 1.3 中心结果

1.4 本章小结

    本章主要先容了关于hello的根本情况,包括它的代码、P2P以及020过程、产生的中心结果文件;扼要说明白完成其一生的环境与工具,为读者留下了初步的概念以及一些牵挂。



第2章 预处理

2.1 预处理的概念与作用

(1)概念:在编译过程中,预处理是编译的第一个阶段,它会根据“#”号开头的命令,完成对源代码举行一些文本替换和使用,生成.i文件。
(2)作用:预处理器通常以程序员在源代码中插入的预处理指令为底子,实行以下使用。它为进一步编译做准备,从而镌汰代码中的重复,提高代码的可维护性。
宏替换
在预处理阶段,预处理器会将源代码中出现的宏名替换为宏定义的代码(比方#define)。
文件包含
预处理器通过 #include 指令,将一个源文件的内容嵌入到另一个源文件中,并将被包含的文件插入到 #include 指令的位置,从而将多个源文件组合成一个。
条件编译
预处理器会通过 #if、#ifdef、#ifndef等指令,条件选择性地编译代码,它允许在差别的编译条件下包含或清除代码块。
表 2.1 预处理的主要作用

2.2在Ubuntu下预处理的命令


在Ubuntu下通过指令 gcc -m64 -no-pie -fno-PIC -E hello.c -o hello.i即可将hello.c文件首先经过预处理生成.i文件
https://i-blog.csdnimg.cn/blog_migrate/af1d2b200acf149fc9b2e9de70edb99e.png
图 2.2 预处理命令
2.3 Hello的预处理结果剖析


打开hello.i文件我们可以发现里面的内容巨幅增加,之前的#include对应的头文件都被替换了相应的内容,并且原文件中所对应的解释和多余空缺都被删除了,如下图2.3:
https://i-blog.csdnimg.cn/blog_migrate/ee41b6a968221ba4905aa8054170ba6c.png
图 2.3 hello预处理结果
2.4 本章小结

本章主要先容了预处理(cpp)的过程,在Ubuntu下通过相关指令得到并对比分析了预处理后得到的.i文件,完成了hello.c编译过程的第一步。


第3章 编译

3.1 编译的概念与作用


(1)概念:在编译过程中,编译是将预处理后的源代码翻译成汇编语言的阶段,完成从 .i 到 .s 即预处理后的文件到汇编语言程序的生成。
(2)作用:编译器将高级语言源代码转换为汇编语言,同时举行一些优化使用,为进一步翻译成机器语言做准备。包含以下使用:
词法、语法、语义分析
编译器将源代码转换为一个个的标志,并将标志流转换成语法树,验证程序是否符合语法规则,最后查抄程序的语义是否精确。
优化
对程序举行各种优化,以提高程序的性能。这包括但不限于内联函数、循环睁开等。
代码生成
将经过优化的中心代码翻译成目的机器的汇编语言代码。
表 3.1 编译的主要作用

3.2 在Ubuntu下编译的命令


在Ubuntu下通过指令 gcc -m64 -no-pie -fno-PIC -S hello.i -o hello.s即可将hello.i文件经过编译器生成.s文件

https://i-blog.csdnimg.cn/blog_migrate/739ffa800f004dd9a3352410d4fdabf7.png
图 3.2 编译命令
3.3 Hello的编译结果剖析

https://i-blog.csdnimg.cn/blog_migrate/038c324ee8d8cce13848b6ccd50daee0.png
图 3.3.1 关于hello.s的所有内容
关于hello.s的一些声明
  
https://i-blog.csdnimg.cn/blog_migrate/0524e99d595caab4abb8cac4d9b5a491.png
图 3.3.2 hello.s中的开始字段
hello采用的是AT&T汇编语法,用于x86-64架构。
(1)file "hello.c":指定源文件名为 "hello.c"。
(2)text:开始代码段。
(3)section .rodata:定义只读数据段。
(4)align 8:将接下来的数据或指令在内存中对齐到8字节界限。
(5)LC0 .string和 LC1.string:定义两个字符串常量。
(6)text:重新定义代码段。
(7)globl main:将 “main” 标志为全局可见,表现这是程序的入口点。
(8)type main, @function:指定 “main” 是一个函数。

3.3.1数据

[*]局部变量
在main函数中可以看到的局部变量有由main函数传入的两个参数argc以及argv,在main中定义的计数变量i。我们知道局部变量会被分配存储到寄存器中,而通常对于参数的通报,在64位使用体系中会按序次用%rdi、%rsi、%rdx、%rcx、%r8、%r9寄存器存储参数,别的参数存储在堆栈当中。在下图3.3.2中不难看出,argc作为第一个参数存储早%edi中,并通过movl指令移动到位于栈上相对于 %rbp 偏移为 -20 的位置;argv是一个数组,它的首地点被放入位于栈上相对于 %rbp 偏移为 -32 的位置;而变量i存储到位于栈上相对于 %rbp 偏移为 -4 的位置。
https://i-blog.csdnimg.cn/blog_migrate/f7250ffd3b0664c32edfd99bf7dafa72.png
图 3.3.2 hello.s中局部变量

参数6
...
参数1
局部变量
上一栈帧的ebp
返回地点
参数7
参数8
...
上一栈帧
表 3.3.1 栈帧结构


[*]常量
  从文件中可以看到有常量到场,比方字符串常量L01和L02,以及存在于体系中的立刻数$4、$1等。另外也能发现在string中英文和数字可以直接表现,而汉字则通过/xxx的UTF-8编码表现。
https://i-blog.csdnimg.cn/blog_migrate/0e870c6e65dd29495274b473fc68dca6.png
图 3.3.3 hello.s中的常量
3.3.2赋值
  以下是一份常用的汇编指令,我们能看到可以用来赋值的指令有mov、lea,而在hello.s中我们能看到许多关于赋值mov的指令,并且可以看到具有指定使用位数的后缀b(1B)、w(2B)、l(4B)、q(8B)。
https://i-blog.csdnimg.cn/blog_migrate/db0423023adf070dcbf11c5fd25f73b4.png
图 3.3.4 hello.s中的赋值
mov
数据传输,将数据从一个地方移到另一个地方
lea
加载有效地点,用于地点盘算
add,sub,mul,div
算术运算,加、减、乘、除
Inc,dec
增加和镌汰,用于递增和递减使用
cmp
比较,比较两个值的大小
jmp
无条件跳转,无条件转移到指定标签或地点
je, jne, jl, jg
条件跳转,根据比较结果举行条件跳转
call
调用函数,跳转到指定的过程或函数
ret
返回,从函数中返回到调用它的地方
push, pop
压栈和弹栈,用于使用栈
and, or, xor
位运算,按位与、按位或、按位异或
shl, shr
位移运算,左移和右移
test
位测试,与指定的值举行按位与使用
nop
空使用,不实行任何使用
表 3.3.2 常用汇编指令

3.3.3算术使用
 根据上表,我们可以在hello.s中看到相应的算术运算使用,典型的比方计数变量i的自增1使用addl  $1  -4(%rbp) 。
https://i-blog.csdnimg.cn/blog_migrate/d63308c8fe58a6eaa45ef21ceea03df3.png
图 3.3.5 hello.s中的算术使用
3.3.4关系使用和控制转移
 关系使用通常与控制转移归并使用,因此将其在此统一说明。在hello.s
中可以看到多处地方使用到cmp指令与jmp的一系列变式,它通常形貌的是程序中的判断if语句以及循环终止条件,如下图3.3.6。
https://i-blog.csdnimg.cn/blog_migrate/298b062333c980e56e564e75e48e957f.png
图 3.3.6 hello.s中的关系使用和控制转移
3.3.5数组/指针/结构使用
 在3.3.1中我们事先提到了关于参数argv作为一个数组,其首地点(指针)被存储到位于栈上相对于 %rbp 偏移为 -32 的位置(即-32(%rbp)),这里我们可以看到argv的首地点(argv的地点)首先传入%rax中,接着做了偏移量增加的使用,完成第二体指令后%rax中的值对应argv的地点,以此类推,第五条指令完成后%rax存储argv的地点。
https://i-blog.csdnimg.cn/blog_migrate/280f101c087d5da6d684c14f13166c1f.png
图 3.3.7 hello.s中的数组使用
3.3.6函数使用
  汇编文件中经常使用call指令举行相关的函数调用,并且函数返回调用ret指令,在下图3.3.8中我们可看到关于puts、exit、printf、atoi、sleep等函数的调用,以及返回指令ret。
https://i-blog.csdnimg.cn/blog_migrate/efbc442f85803c8d2438516baa8d2f3e.png
图 3.3.8 hello.s中的函数使用
3.3.7类型转换使用
 在函数调用中我们发现atoi函数实现了一个欺压类型转换的作用,上图中%rdi存储了来自%rax对应的参数,并传入atoi函数中举行char到int类型的欺压类型转换。
3.4 本章小结

在本章中,我们探讨了编译的概念和过程,以及通过编译器(比方ccl)将C程序转化为汇编程序(.s文件)的过程。本章重点先容了“hello” 程序的编译结果,详细解释了.s文件中的文件内容,深度剖析了数字、字符串、数组等数据结构,以及一些常见的汇编语言使用,比方赋值、算术使用、关系使用、控制转移、函数使用等。通过对这些使用的剖析,为下一章讨论汇编语言打下了底子。

第4章 汇编

4.1 汇编的概念与作用



[*]概念:在编译过程中,汇编是将汇编语言代码翻译成机器代码的阶段,完成从 .s到 .o 即汇编语言程序到二进制可重定位目的文件的生成。
(2)作用:汇编器将汇编语言的代码翻译成机器代码,生成基于硬件架构上的指令、符号表以及重定位条目,使生成的目的文件包含精确的地点信息,以便在链接时和运行时可以大概精确地与其他模块毗连。
4.2 在Ubuntu下汇编的命令

在Ubuntu下通过指令 gcc -m64 -no-pie -fno-PIC -c hello.s -o hello.o即可将hello.s文件经过汇编器生成.o文件

https://i-blog.csdnimg.cn/blog_migrate/f46dd50ff1dfb70861fdd6fab7bf3d1f.png
图 4.2 汇编命令
4.3 可重定位目的elf格式

在终端中输入指令readelf -a hello.o > hello.elf即可得到hello.o的elf文件
https://i-blog.csdnimg.cn/blog_migrate/a0b1d7628bf838fd85a90c74defe69ac.png
图 4.3.1 hello.o的elf文件

4.3.1ELF头
在《深入理解盘算机体系》中先容到ELF以一个16字节的序列开始,这个序列形貌了生成该文件的体系的字的大小和字节顺序。在ELF头中可以看到目的文件的类型、体系架构信息、节头大小和数量等信息。
https://i-blog.csdnimg.cn/blog_migrate/0ad9fc62b9e99c79b18c19c3967802fc.png
图 4.3.2 hello.o的elf头

4.3.2节头部表
加载ELF头与节头部表之间的都是节,在所有节中可以大概看到一些熟悉的节,比方.text、.data、.bss、rodata等,这些节的信息存储在节头部表中,包括名称、类型、地点、偏移量等等。这里简单地先容一下相关的节,如下表4.3:
.text
已编译程序的机器代码
.rodata
记载只读数据,比方printf语句中的格式串和开关语句中的跳转表
.data
已经初始化的全局变量和静态变量(注:局部变量在运行时保存在栈中,不出现在.data以及.bss中)
.bss
未初始化的全局变量和静态变量,以及所有被初始化为0的全局或静态变量。
.symtab
存放程序中定义和引用的函数和全局变量的信息的一个符号表
.rel.text
一个.text节中位置的列表
.rel.data
被模块引用或定义的所有全局变量的重定位信息
.debug
调试符号表
.line
原始源程序中的行号和.text节中机器指令之间的映射
.strtab
字符串表
表 4.3 常见节段


https://i-blog.csdnimg.cn/blog_migrate/c25e0bc0cdae10e0fbbe9e4e86956ced.png
图 4.3.3 hello.o的节头部表

4.3.3重定位节
重定位节是可重定位目的文件的紧张组成部分,我们知道在程序终极酿成可实行文件前需要将一些符号举行应用和剖析、同时要将一些特定的外部函数(比方c中的printf)的地点举行定位,这是链接器最后所做的,在这之前,汇编器会事先在相应的节中生成重定位条目(重定位节),以便链接器不加甄别地举行重定位使用。可以看到elf文件中.rlea.text以及.rela.eh.frame所对应的重定位条目,里面记载着一些需要重定位的符号puts、exit等以及他们的偏移量。
https://i-blog.csdnimg.cn/blog_migrate/49aeeee366c4aa83c82a9b55344b07b3.png
图 4.3.4 hello.o的重定位节
4.3.4符号表
符号表是由汇编器生成的,使用编译器输出到汇编语言.s中的符号。此中可以看到一些符号的偏移量(value)、大小(size)、类型(type)等信息,值得留意的是,它标识了一些需要重定位函数和变量的信息
https://i-blog.csdnimg.cn/blog_migrate/ed316a144920321e1c9dd7fb64f21bb6.png
图 4.3.5 hello.o的符号表

4.4 Hello.o的结果剖析

在Ubuntu下根据objdump -d -r hello.o > hello.asm生成关于hello.o的反汇编内容。如下图4.4.1:
https://i-blog.csdnimg.cn/blog_migrate/bfc5db335a73178a8830f573fbfcb979.png
图 4.4.1 hello.o反汇编内容生成指令

打开反汇编文件我们可以发现此中的内容与上一章.s文件有相同又有差别。在反汇编文件中,左侧表现的是一些机器码,而右侧表现的是有过修改的汇编语言,此中立刻数从原来的十进制变为十六进制,同时控制转移的跳转指令变为了关于地点盘算的相对偏移地点寻址,并且一些有关的指令后缀(比方b、l)被省略了,
可以说这种变化将更加贴近机器层面的语言。
https://i-blog.csdnimg.cn/blog_migrate/e7e4b9504024ca4b00022864e77b299b.png
图 4.4.2 hello.o反汇编内容
4.5 本章小结

本章先容了汇编器生成可重定位目的文件的过程,重点说明白该.o文件的elf格式文件的结构和内容,同时对比分析了由该.o文件生成的反汇编文件的关于立刻数以及函数调用、控制转移的变化,彰显了汇编阶段的紧张作用,为下一章链接打下底子。

第5章 链接

5.1 链接的概念与作用

(1)概念:链接阶段是将多个目的文件和库文件组合成终极的可实行文件的阶段,是将各种代码和数据片断网络并组合成为一个单一文件的过程。这个阶段由链接器完成,从 hello.o 生成hello可实行文件。
(2)作用:借助符号表,有时按照符号的强弱对符号举行剖析,使得每个引用都与符号表中的一个确定的符号唯一关联,同时举行重定位,完成关于节以及节中的符号引用重定位。
5.2 在Ubuntu下链接的命令

这里使用ld的链接命令ld -o hello -dynamic-linker /lib64/ld-linux-x86-64.so.2 /usr/lib/x86_64-linux-gnu/crt1.o /usr/lib/x86_64-linux-gnu/crti.o hello.o /usr/lib/x86_64-linux-gnu/libc.so /usr/lib/x86_64-linux-gnu/crtn.o举行链接,需要留意的是应该不只毗连hello.o文件。
https://i-blog.csdnimg.cn/blog_migrate/265929262bc74d0fb524271ceb712b39.png
图 5.2 hello链接命令
5.3 可实行目的文件hello的格式

同样的,输入指令readelf -a hello > Hello.elf得到hello的elf文件
https://i-blog.csdnimg.cn/blog_migrate/f5ee7e1c717f57164937a0a16f74e8fe.png
图 5.3.1 hello的elf文件

打开elf文件后可以看到其结构大致与上一章相同,差别的是其内容大幅增加,在ELF头中某些参量发生改变。
https://i-blog.csdnimg.cn/blog_migrate/44cc485eedb0c2592b6f25a97f9bd557.png
图 5.3.2 hello的elf头

同时新增加了程序头、dynamic段,并发现dynamic段上记载着共享库等信息
https://i-blog.csdnimg.cn/blog_migrate/7e51f436d99727e8de8a749e7821bbbf.png
图 5.3.2 hello的程序头、dynamic段

最紧张的是,节头部表中的节增多,重定位条目和字符表发生了更新,
https://i-blog.csdnimg.cn/blog_migrate/f71e69ea1ffbf129c093047d078de0dc.png
图 5.3.3 hello节头部表
https://i-blog.csdnimg.cn/blog_migrate/24fdd34b5fa027d79660a4319a992747.png
图 5.3.4 hello的elf文件相关更新
5.4 hello的假造地点空间

这里我们在Ubuntu中使用edb加载hello,可以大概查看本进程的假造地点空间各段信息。在edb的data dump中可以看到关于elf文件的二进制信息,此中非常显着的便是ELF头在0x400000处的16字开始序列。而在5.3中程序头中可以看到INTERP标志性的/lib64/ld-linux-x86-64.so.2,同时留意到其VirtAddr为0x400200,因此data dump中找到00400200,它对应着INTERP的假造地点。同理,关于程序头中标出的各个段的假造地点在datadump中都有对应。

https://i-blog.csdnimg.cn/blog_migrate/8e42055ddd2cfb9b0ccc50e58ee85d88.png
图 5.4 edb查看hello的elf文件

5.5 链接的重定位过程分析

在终端下通过指令objdump -d -r hello > Hello.asm生成可实行文件hello的反汇编文件,打开后可以发现,相比之前的hello.asm此文件篇幅增长,并且在main函数之前多出了关于.init、.plt段的反汇编内容,而在.text段中除了main另有更多比方_start的反汇编内容。这说明链接器在链接的过程中,将main函数中共享库中所用到的函数成功链接到可实行文件中。
https://i-blog.csdnimg.cn/blog_migrate/816e29a33ad4f1679fe5419538b46351.png
图 5.5.1 hello反汇编内容生成指令
https://i-blog.csdnimg.cn/blog_migrate/5aba6eb5f483935a572e81e1cef0305e.png
图 5.5.2 hello反汇编内容

同时对比main函数的反汇编内容,可以清楚的看到原来在代码中标志为重定位类型R_X86_64_32以及R_X86_64_PC32的对应机器码由零值被赋予了假造地点,此中控制跳转指令的跳转地点用对应函数的地点加偏移量盘算得出;.rodata字段举行了绝对地点的引用;函数调用举行了相对地点的引用。
https://i-blog.csdnimg.cn/blog_migrate/dd661565095f47c6d6730d31419e2c1f.png
图 5.5.3 hello与hello.o反汇编内容对比

5.6 hello的实行流程

在Ubuntu下使用edb实行hello,加载hello到_start,到call main,以及程序终止后,可以依次看到对应的函数历程以及地点。
_init
0x4004c0
puts@plt
0x4004f0
printf@plt
0x400500
getchar@plt
0x400510
atoi@plt
0x400520
exit@plt
0x400530
sleep@plt
0x400540
_start
0x400550
_dl_relocate_static_pie
0x400580
main
0x400586
__libc_csu_init
0x400610
__libc_csu_fini
0x400680
_fini
0x400684
表 5.6 hello的对应的函数历程以及地点

https://i-blog.csdnimg.cn/blog_migrate/3caa53f8ec0eb8f844268835a12259c9.png
图 5.6 edb查看hello中对应的函数
5.7 Hello的动态链接分析

在《深入理盘算机体系》中第七章关于链接中讲到动态链接时,动态链接器会重定位全局偏移量表(GOT)中的每个条目,使得它包含精确的绝对地点,联合Hello.asm中的节头部表的中的信息不难看出,我们可以通过观察got.plt节的内容变化来简单说明dl_init前后动态链接项目的变化。
https://i-blog.csdnimg.cn/blog_migrate/cad9b4cc5ef192531f239852034cb88b.png
图 5.7 edb查看hello中got.plt的假造地点变化
可以看到got.plt的假造地点为00600ff0,在运行程序前对应的内容为零值,运行hello后它的值发生了变化,说明动态链接项目都发生了变化。
5.8 本章小结

本章主要先容了程序编译过程中的最后一步链接,重点对比上一章分析了毗连器链接产物——hello可实行文件的elf文件内容以及它的反汇编文件,剖析了链接器在此中关于符号剖析、重定位的作用,同时展示了hello的运行流程中相关函数的调用以及动态链接时链接项目的变化。至此,hello已经成为完备的“个体”,他将步入进程之中继续完成他的一生。

第6章 hello进程管理

6.1 进程的概念与作用

(1)概念:进程是使用体系举行资源分配的最小单位,是一个程序的一次实行过程,是一个实行中程序的实例。
(2)作用:提供给应用程序两个关键的抽象,一是逻辑控制流,造成每个进程独占CPU使用的假象(通过OS内核的上下文切换机制提供);二是私有地点空间,造成每个进程独占内存体系的假象(OS内核的假造内存机制实现)。
6.2 简述壳Shell-bash的作用与处理流程

我们知道Shell是一种用于与使用体系内核举行交互的命令行解释器。它是用户与使用体系之间的接口,允许用户通过命令行输入来与盘算机举行交互。Shell担当用户的命令并将其解释为使用体系可以理解的指令,然后实行这些指令。
其作用有:(1)命令行解释和实行(2)文件体系使用(3)环境设置(4)进程控制(5)脚本编程(6)输入输出重定向(7)管道使用(8)通配符和正则表达式的模式匹配和搜索。
相关的处理流程为:命令输入->命令解释->命令查找->命令实行->输入表现->等待用户输入。
https://i-blog.csdnimg.cn/blog_migrate/965e841d6538c5c70c6fdf9e7b5d9f3f.png
图 6.2 shell与体系的关系


6.3 Hello的fork进程创建过程

当用户在shell中输入./hello(表现运行hello可实行文件)时 ,shell首先判断剖析“./hello”是否为内置指令,然后在当前目次下找到它,使用体系调用fork函数为hello创建一个子进程,并在该新进程的上下文中运行hello。值得留意的是子进程获得了一份与父进程用户级假造地点空间相同的独立的副本,包括代码和数据段、堆、共享库以及用户栈;同时可以读写父进程中打开的任何文件。而唯一的区别在于他与父进程的PID差别。别的,在《深入理解盘算机体系》一书中也夸大父进程和子进程是并发运行的独立进程。使用指令strace -f ./hello可以跟踪hello进程运行。
https://i-blog.csdnimg.cn/blog_migrate/b716855bb73cbcf711d1454948c2a77b.png
图 6.3 strace -f ./hello 跟踪hello进程
6.4 Hello的execve过程

execve函数可以大概在当进步程的上下文中加载并运行一个新程序,同时携带参数列表argv和环境变量列表envp,值得留意的是该函数只有当出现错误时才能返回到调用程序,否则该函数调用一次从不返回。在execve函数加载了hello之后,它调用加载器删除子进程现有的假造内存段,并创建一组新的代码、数据、堆和栈段(初始化为零),通过将假造地点空间中的页映射到hello的页大小的片,将hello中的代码和数据初始化在新的代码和数据,然后通过跳转到程序的第一条指令或入口点来运行该程序(也就是_start函数的地点),终极调用main函数。
6.5 Hello的进程实行

在分析hello进程实行的过程之前,首先来了解一下什么是上下文、时间片以及用户态和焦点态。
什么是上下文?上下文指的是程序或体系当前的实行环境和状态,涵盖了程序状态、寄存器值、内存映射、文件形貌符、信号处理器等多个方面的信息,用于形貌程序或体系的实行环境和运行状态。在使用体系中,上下文主要分为进程上下文和中断上下文两种类型。

https://i-blog.csdnimg.cn/blog_migrate/3941d4d3547dc00fae06890f085d9a56.png
图 6.5.1 进程的上下文切换
什么是时间片?时间片是使用体系中用于实现多使命调理的一种技术。由于使用体系需要公道分配CPU时间给多个进程或线程,使它们交替实行,以实现同时运行多个使命的效果,总的CPU时间被切割为多少个短小的时间段,每个时间段被称为一个时间片。每个进程或线程在一个时间片内实行一定命量的指令,然后切换到下一个进程或线程,通过这种方式实现了多使命的调理。
什么是用户态和焦点态?用户态和焦点态是指在盘算机体系中CPU的运行权限和访问资源的级别。在用户态下,程序只能实行有限的指令集且无法直接访问底层硬件资源,而在焦点态下,具备更高的权限,可以实行特权指令和直接访问体系资源。使用体系通过在用户态和焦点态之间切换来保障体系的安全性和稳固性。
https://i-blog.csdnimg.cn/blog_migrate/939246c837a88c441933c45bc1923608.png
图 6.5.2 用户态与内核态的切换

因此,当用户在shell中输入`./hello`运行可实行文件"hello"时,使用体系会创建一个新的进程,称为hello进程。在进程的上下文信息中,包含了程序的状态、寄存器值、内存映射、文件形貌符等信息。这个新创建的进程首先处于用户态,只能实行一样平常的用户级指令。
随后,使用体系将为hello进程分配一个时间片,即一段短小的CPU实行时间。在这个时间片内,hello进程开始实行,运行相应的程序指令。如果在时间片结束前hello进程未实行完,使用体系会停息该进程,并将控制权切换到其他处于就绪态的进程。
在进程切换的过程中,涉及用户态到焦点态的转换。比方,当使用体系需要访问底层硬件资源或实行特权指令时,就会举行用户态到焦点态的切换。这样的切换确保了体系的安全性和资源保护。
整个进程调理过程不断重复,多个进程在差别时间片内轮番实行,实现了多使命的效果。这样的调理机制包管了体系的高效运行和资源公道使用。
6.6 hello的非常与信号处理

 hello实行过程中会出现哪几类非常,会产生哪些信号,又怎么处理的。
我们知道非常是使用体系中一个紧张的机制,它通过中断向量表或非常表来指定对应非常的处理程序。当非常发生时,控制权被通报到相应的非常处理程序,从而使体系可以大概采取得当的步伐,可分为四种类型——中断(异步,一样平常由外部I/O设备引起,处理完成返回到下一条指令)、陷阱(同步,故意的发生,处理完成返回到下一条指令)、故障(同步,不是故意的,处理完成返回重新实行该指令或者终止)、终止(同步,非故意且不可修复,处理时终止当前程序)。可以明确的是在实行hello的过程中上述非常都有大概发生。
信号是在软件层次上对中断机制的一种模仿,是一种异步通信方式,所有信号的产生以及处理全部是由内核完成的;包括信号的产生、发送、阻塞以及担当处理,以下是常用的信号。应当留意的是信号不是非常的一种,并且它的处理方式与非常中的xxx类似,在调用处理子程序完毕后会返回并实行下一条指令。
SIGHUP
该信号在用户终端关闭时产生,通常是发给和该终端关联的会话内的所有进程
终止
SIGINT
该信号在用户键入INTR字符(Ctrl-C)时产生,内核发送此信号送到当前终端的所有前台进程
终止
SIGQUIT
该信号和SIGINT类似,但由QUIT字符(通常是Ctrl-)来产生
终止
SIGILL
该信号在一个进程企图实行一条非法指令时产生
终止
SIGSEV
该信号在非法访问内存时产生,如野指针、缓冲区溢出
终止
SIGPIPE
当进程往一个没有读端的管道中写入时产生,代表“管道断裂”
终止
SIGKILL
该信号用来结束进程,并且不能被捕获和忽略
停息进程
表 6.6 常见信号类型与作用

 以下分析各种命令在程序运行过程中的实行。比方不停乱按键盘,包括回车,Ctrl-Z,Ctrl-C等(Ctrl-z后可以运行ps  jobs  pstree  fg  kill 等命令)。
(1)正常实行:设定休眠时间为两秒实行程序。
https://i-blog.csdnimg.cn/blog_migrate/364c4fa93dd980a54b864f1e36459f21.png
图 6.6.1 进程正常实行

[*]不停乱按键盘:可以看出shell实验将随便输入的字符、空格、回车等做为命令解读。
https://i-blog.csdnimg.cn/blog_migrate/96e9a42f991332297125b9dcd86984f5.png
图 6.6.2 进程时实行举行随意输入


[*]在实行过程中按Ctrl+C:发送SIGINT信号给前台进程组中的每个进程,举行终止使用,同时发现进程组中hello已被回收。
https://i-blog.csdnimg.cn/blog_migrate/6e69aece83d0d1c182109e5861757aad.png
图 6.6.3 进程实行时按Ctrl+ C


[*]在实行过程中按Ctrl+Z:发送SIGTSTP信号给前台进程组中的每个进程,举行制止使用,此时发现进程组中hello标识为“已制止”的状态,输入ps指令可以看到hello仍然在进程组中,输入fg使hello继续完成实行。
https://i-blog.csdnimg.cn/blog_migrate/cbf94ac187fcf8616d9e2e93b8e95dd7.png
图 6.6.4 进程实行时按Ctrl+ Z


[*]Ctrl+Z后输入pstree指令查看进程树状图
https://i-blog.csdnimg.cn/blog_migrate/8416deefd2be7c007fa1232cbde83684.png
图 6.6.5 进程制止后查看进程树状图


[*]Ctrl+Z后输入kill指令
https://i-blog.csdnimg.cn/blog_migrate/03a012a2dd0ebb568b213f4a7a08de51.png
图 6.6.6 进程制止后发送kill指令

6.7本章小结

本章主要先容了hello进程的实行流程,讲述了进程和shell的概念与作用,并且通过分析hello进程的创建、加载以及实行和形貌hello大概碰到的非常与信号处理,说明白hello进程管理时使用体系对进程的调理和管理,复习了非常和信号的处理机制。至此我们已经形貌了helloP2P的过程。

第7章 hello的存储管理

7.1 hello的存储器地点空间

我们知道盘算机有一套独特的寻址体系,对于每一个程序,它需要经过从逻辑地点转换到线性地点(段式使用),再从假造地点转换到物理地点(页式使用)的过程,这里我们联合hello程序分析一下这些奇妙的地点使用。
首先,逻辑地点指的是程序中产生的与段相关的偏移地点部分。它是相对于当进步程数据段的地点,差别于绝对物理地点。在Intel实模式下,逻辑地点和物理地点相等,因为实模式没有分段或分页机制,CPU不举行主动地点转换。而在Intel保护模式下,逻辑地点是指程序实行代码段限长内的偏移地点。
比方在hello.asm中可以看到关于puts的逻辑地点的段内偏移量为 0x1f。逻辑地点是由段号+段内偏移量构成,这个地点是相对于当前指令的偏移,通过盘算跳转指令(callq)到 puts 函数的偏移得到。
https://i-blog.csdnimg.cn/blog_migrate/b83d1d0d2895aa609c78d2d70714d9e9.png
图 7.1.1 逻辑地点对应的偏移量
而线性地点是逻辑地点到物理地点变更之间的中心层。程序代码会产生逻辑地点,或者说是段中的偏移地点,加上相应段的基地点就生成了一个线性地点。一样平常而言,我们认为假造地点就是线性地点,在IA32中,假造地点需要经过到线性地点再到物理地点的变更,而IA6中,假造地点可以是逻辑地点,也是线性地点。
https://i-blog.csdnimg.cn/blog_migrate/92042421fd7dd1e4ffabb511b3bade29.png
图 7.1.2 线性地点
物理地点是进程及其内容放置在主内存或硬盘中的地点,该地点不能直接由用户程序访问或查看,因此需要将逻辑地点映射到该地点。如果启用了分页机制,那么线性地点会使用页目次和页表中的项变更成物理地点;但是如果没有启用分页机制,则线性地点就直接成为物理地点。
7.2 Intel逻辑地点到线性地点的变更-段式管理

我们之条件到关于逻辑地点到线性地点的变化,它遵照一个段式管理的处理方式,详细如下图7.2.1:
https://i-blog.csdnimg.cn/blog_migrate/edec8fdd458c0a37116c36881618fc5e.png
图 7.2.1 逻辑地点到线性地点的变更
此中段选择符存放在段寄存器中,它由三个主要的字段构成,分别是索引(当前使用的段形貌符在形貌表中的位置)、TI(0值表现选择的是全局形貌符表GDT,1值表现选择的是局部形貌符表LDT)和RPL(表现CPU的当前特权级,00是最高级的内核态);而段形貌表实际就是段表,由段形貌符(段表项)构成,分为全局形貌符表GDT、局部形貌符表LDT以及中断形貌符表IDT;段形貌符是一种数据结构,又分为用户代码段和数据段形貌符、体系控制段形貌符。形貌起来大致如下图7.2.2所示:
https://i-blog.csdnimg.cn/blog_migrate/4f47fd492ced01c597d12eb6d0ca7ab6.png
图 7.2.2 段式管理

7.3 Hello的线性地点到物理地点的变更-页式管理

在举行完段式管理后,使用体系将举行从线性地点(VA)到物理地点(PA)之间的变更,使用的是页式管理的机制。在概念上,假造内存被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组;磁盘上数组的内容被缓存在主存中,和存储器结构层次中其他缓存一样,磁盘上的数据被切割成块,这些块作为磁盘和主存之间的的传输单元。而VM体系将假造内存分割出的固定大小的块称之为假造页(VP),通常情况下假造页的大小固定为4K,而一个大小为2的k次方的页,其假造页和物理页偏移量都为k位。
为了可以大概准确地对应上假造页与物理页之间的存放替换,在物理内存中还存放着一个页表的数据结构,它是一个页表条目(PTE)的数组,使得假造空间的每个页在页表中一个固定的偏移量处都有一个PTE,它由一个有效位和n位地点字段组成。而MMU(内存管理单元)终极通过页表实现将假造页映射到物理页。
https://i-blog.csdnimg.cn/blog_migrate/d8419d479b89ad3bbe2c1d1424a856da.png
图 7.3.1 常驻内存的页表
值得留意的是,在每个PTE中另有有效位这一标识位,当假造页号(VPN)和假造页偏移量(VPO)确定后,便可定位到唯一的一个PTE条目,同时假造页偏移量直接对应物理页偏移量,此刻页表基址寄存器通过比较有效位来完成物理页号的对应。当有效位为0时,如果该PTE的地点字段为空NULL,说明该假造页未被缓存;如果不为空则说明该假造页已经缓存但没有被分配。当有效位是1则代表该内存已经缓存在了物理内存中,此时可以得到其物理页号(PPN)已经物理地点。
https://i-blog.csdnimg.cn/blog_migrate/1aa0642840d2688c307b6dfc330edf0c.png
图 7.3.2 假造地点到物理地点的变更

7.4 TLB与四级页表支持下的VA到PA的变更

首先了解一下什么是TLB以及多级页表
TLB(快表)是盘算机体系中的一种高速缓存,用于加速假造地点到物理地点的转换过程。在采用假造内存的体系中,程序使用假造地点来访问内存,而这些假造地点需要经过地点翻译过程,将其映射到实际的物理地点。TLB的主要作用是缓存最近使用的假造地点到物理地点的映射关系,避免每次地点翻译都需要访问内存中的页表。TLB可以存储一部分页表的内容,以加速地点转换的速率,因此可以理解为MMU本身的cache。值得留意的是MMU会传入假造页号(VPN)给TLB,如果有2的t次方个组(通常形貌为“2的t次方”路组相联),那么TLB索引(TLBI)就是由VPN的t个最低位构成的,VPN的剩余位则表现TLB标志(TLBT)。
https://i-blog.csdnimg.cn/blog_migrate/cb73d7e222c0500b2c06b28629c0016a.png
图 7.4.1 TLB在CPU中的关系
多级页表是一种用于管理假造内存地点到物理内存地点映射的机制,主要用于支持大型假造地点空间。在多级页表中,页表的结构被分层组织,形成一个树状结构,而不是单一的一维数组。通过多级页表,体系可以将大型的假造地点空间分割成多个小块,每个小块通过一个页表级别举行映射。这样的分层结构使得体系在实际使用时只需加载和维护那些真正被使用的页表,而不是整个页表,提高了内存管理的效率,降低了内存开销。
https://i-blog.csdnimg.cn/blog_migrate/a581ca70c3e2bbf4126855daeb11a16c.png
图 7.4.2 二级页表

《深入理解盘算机体系》中给出了关于Inter Core i7 / Linux体系下关于TLB以及四级页表的分析案例,从中可以看到,Core i7实现支持48位假造地点空间和52位物理地点空间,TLB为四路组相联(2的2次方),页大小为4KB(2的12次方),L1-cache的块大小为64字节(2的6次方)且是8路组相联的,一共64组(2的6次方)。
从上述信息可以经过盘算得到,假造页偏移量(VPO)和物理页偏移量(PPO)为12位,以是假造页号(VPN)有36位,此中的最低两位表现TLB索引(TLBI),剩余的位则表现TLB标志(TLBT);同样的,物理页号(PPN)有40位,而为了举行物理页的翻译,其PPO被分为最低6位块偏移(CO)以及剩余6位组索引(CI);其PPN对应的40位则作为标志(CT)。
https://i-blog.csdnimg.cn/blog_migrate/7c843b9fc0deb02893d888ddf1ef0022.png
图 7.4.3 TLB与多级页表下假造地点到物理地点的映射

此刻,CPU 产生假造地点 VA,并将VA 传送给 MMU。MMU 使用前 36 位 VPN 作为 TLBT+TLBI向 TLB 中匹配,如果掷中,则得到 PPN,同时与其和 VPO组合成 PA。 如果 TLB 中没有掷中,MMU 向页表中查询, VPN1确定在第一级页表中的偏移量,抽取出 PTE,如果在物理内存则继续确定第二级页表的起始地点,以此类推。终极我们可以在第四级页表中查询到 PPN并与 VPO 组合成 PA,向 TLB 中添加条目;否则引发缺页故障。
https://i-blog.csdnimg.cn/blog_migrate/ab8e3e5fe909655695759a1fc684c9a3.png
图 7.4.4 多级页表组织下的VPN与PPN

7.5 三级Cache支持下的物理内存访问

在开始时MMU从假造地点中抽出VPN,并查抄TLB,看它是否因为前面的某个内存引用缓存了PTE的一个副本。TLB从VPN中抽取出TLB索引(TLBI)和TLB标志(TLBT),和组中条目举行匹配,并依次比较每个cache中的数据,如果此中有掷中,则将缓存的数据返回给MMU,否则MMU需要从主存中取出相应的PTE。接着MMU发送物理地点给缓存,缓存从物理地点中抽取出缓存偏移量(CO)、缓存组索引(CI)以及缓存标志(CT),用CT与组中标志匹配,如果掷中则读出偏移量CO处的数据字节,并将它返回给MMU,随后MMU将它返回给CPU。
https://i-blog.csdnimg.cn/blog_migrate/fe8f6224e979f5bad74c8726aaf359c0.png
图 7.5 三级cache的物理访存

7.6 hello进程fork时的内存映射

再看fork函数时,我们便可以清楚地看到fork函数是怎样创建一个带有本身独立假造地点空间的新进程了。
《深入理解盘算机体系》中讲到,当fork函数被当进步程调用时,内核会为新进程创建各种数据结构,并分配给它一个唯一的PID。而为了给这个新进程创建假造内存,它创建了当进步程的mm_struct、地区结构和页表的原样副本,同时将两个进程中的每个页面都标志为只读,并将两个进程中的每一地区结构都标志为私有的写时复制。
写时复制是在调用 `fork()` 之后,内核会将父进程中所有的内存页权限设置为只读,然后子进程的地点空间被映射到父进程的地点空间。当父子进程都只读内存时,这种共享是安全的。然而,当此中一个进程实验写入内存时,CPU硬件检测到内存页是只读的,于是触发页非常中断。接着,内核的中断处理例程参与,复制触发非常的页,使父子进程各自拥有独立的一份数据。这样,每个进程都可以大概独立修改它们的数据,而不会影响到对方。
因此,当fork函数在新进程返回时,一样平常情况下新进程现在的假造内存刚好和调用fork函数时存在的假造内存相同,如果两个进程中的任何一个厥后举行了写使用,写时复制机制就会创建新页面。
7.7 hello进程execve时的内存映射

我们知道在execve函数加载了hello之后,它调用加载器删除子进程现有的假造内存段,并创建一组新的代码、数据、堆和栈段(初始化为零)。再进一步看exevce函数时不难发现,在加载hello时它会首先删除已存在的用户地区并映射私有地区(为hello的代码、数据、bss和栈创建新的地区),所有的这些新的地区都是私有的、写时复制的,此中代码和数据被映射到hello文件中的.text和.data地区;.bss和堆栈地区都将请求二进制零,映射到匿名文件。接着将共享对象动态链接到hello程序中去,然后再映射到用户假造地点空间中的共享地区中。最后execve函数设置当进步程上下文中的程序计数器,让它指向代码地区的入口点。
https://i-blog.csdnimg.cn/blog_migrate/54f7ec9280eea610d8adc6464b4dfbc4.png
图 7.7 加载器对用户地点空间的映射


7.8 缺页故障与缺页中断处理

缺页故障是指程序在访问某个假造内存地点的时候,对应的物理页不在内存中,需要从磁盘或其他存储介质中调入。缺页故障触发了使用体系的缺页中断处理。
当缺页故障发生时,CPU会停息当前指令的实行,将控制权交给使用体系内核,使用体系会根据缺页故障的地点信息,通过页表等数据结构找到对应的物理页,如果该物理页尚未载入内存,则举行页面调理将相应的数据载入内存,并更新页表。然后,使用体系重新启动被中断的指令,使其可以大概正常实行。
当Linux体系碰到缺页非常时,它会首先判断两个“正当”——假造地点是否正当?对内存的访问是否正当?缺页处理程序可以大概搜索地区结构中的链表把假造地点与每个地区结构中的vm_start和vm_end做出比较,如果假造地点不正当便会出现一个段错误从而终止该进程;同时体系会查抄进程是否具有读写或者实行这个地区页面的权限,让不正当的访问触发保护非常以此来终止该进程。但在大多数情况下面对的是一个正常的缺页,此时它会选择一个捐躯页面,如果这个捐躯页面被修改过则将它交换出去,换入新的页面并更新页表;当缺页处理程序返回时CPU将重新启动缺页的指令,使得该指令再次将假造地点发送给MMU,此时MMU便能正常翻译假造地点。
https://i-blog.csdnimg.cn/blog_migrate/05482b3674c6ffab5ece2253fb6cd94b.png
图 7.8 Linux对缺页故障的处理


7.9动态存储分配管理

在编写程序时我们经常面对知道程序运行时才知道某些数据结构的大小,为解决这个问题,动态内存分配器将提供额外的假造内存。动态内存分配器维护着一个进程的假造内存地区,称为堆(一个请求二进制零的地区,它紧接在未初始化的数据地区后开始并向上生长)。对于每个进程,内核维护着一个变量brk,它指向堆的顶部。
《深入理解盘算机体系》中提到分配器将堆视为一组差别大小的块的聚集来维护。每个块就是一个连续的假造内存片,要么是已分配的,要么是空闲的。已分配的块显式地保留为供应用程序使用,而空闲块可以用来分配,此时空闲块保持空闲,直到它显式地被应用所分配。一个已分配的块保持已分配状态,直到它被开释。这种开释要么是应用程序显式实行的,要么是内存分配器自身隐式实行的。
一样平常情况下,动态内存管理通过内存分配函数(如`malloc`、`calloc`、`realloc`)和内存开释函数(如`free`)实现。程序可以根据需要动态分配内存,但也需要负责开释不再使用的内存以防止内存泄漏。策略涉及内存分配算法的选择(如初次适应、最佳适应等)、处理内存碎片的方法、使用内存池和缓存机制,以及垃圾回收等。
7.10本章小结

本章主要先容了hello的存储器地点空间知识,详细说明白逻辑地点、线性地点(假造地点)、物理地点之间的变更关系以及处理机制,同时以《深入理解盘算机体系》一书中关于Inter Core i7为例分析了关于TLB、多级页表和多级cache的运用,并且通过回首fork与execve函数进一步分析了他们对内存映射的使用。最后我们先容了缺页故障以及它的处理机制,简单讲述了关于动态存储的分配管理,表现了盘算机体系关于假造内存的神奇运用。

第8章 hello的IO管理

8.1 Linux的IO设备管理方法

设备的模型化:文件
设备管理:unix io接口
Linux 的 I/O 设备管理方法基于文件体系的思想,将所有设备抽象为文件,通过文件形貌符举行访问和控制。每个设备都被视为一个特别的文件,可以使用尺度的文件 I/O 使用(如 read、write、open)来举行输入输出,而设备文件通常位于 `/dev` 目次下,Linux 通过文件体系的统一性,将设备的访问、控制和管理与普通文件一致化。别的,Linux 采用设备驱动模型,通过内核中的设备驱动程序管理各类硬件,将硬件底层细节与上层应用程序隔离,使得应用程序更专注于高层逻辑而无需关心底层硬件实现。
8.2 简述Unix IO接口及其函数

I/O 接口是盘算机体系中用于毗连和交换信息的通道,负责盘算机与外部设备之间的数据传输和控制信号通报,是毗连CPU与外设之间的部件,它完成CPU与外界的信息传送。还包括辅助CPU工作的外围电路,如中断控制器、DMA控制器、定时器、高速cache。
https://i-blog.csdnimg.cn/blog_migrate/a5d20f9340d9e29b79d378844cc03e5e.png
图 8.2 简单的I/O接口


Unix I/O接口提供了一套用于举行输入和输出使用的函数和体系调用,这些函数和体系调用在Unix-like使用体系中(包括Linux)被广泛使用。以下是一些常见的Unix I/O函数:
open
用于打开文件,返回文件形貌符
read
从文件形貌符中读取数据
write
将数据写入文件形貌符
close
关闭文件形貌符
lseek
在文件中移动读/写指针
fcntl
对文件形貌符举行各种控制使用
ioctl
提供对文件形貌符的设备控制
select/poll/epoll
用于多路复用 I/O 使用
表 8.2 常见的Unix I/O函数

8.3 printf的实现分析

https://www.cnblogs.com/pianist/p/3315801.html
分析printf函数时需要从vsprintf生成表现信息,到write体系函数,到陷阱-体系调用 int 0x80或syscall等举行讨论
首先来看一下printf函数的内容:

[*]#ifndef _VALIST
[*]#define _VALIST
[*]typedef char *va_list;
[*]#endif                /* _VALIST */
[*]typedef int acpi_native_int;
[*]#define  _AUPBND                (sizeof (acpi_native_int) - 1)                               // 入栈4字节对齐
[*]#define  _ADNBND                (sizeof (acpi_native_int) - 1)                               // 出栈4字节对齐
[*]#define _bnd(X, bnd)            (((sizeof (X)) + (bnd)) & (~(bnd)))                          // 4字节对齐
[*]#define va_arg(ap, T)           (*(T *)(((ap) += (_bnd (T, _AUPBND))) - (_bnd (T,_ADNBND)))) // 按照4字节对齐取下一个可变参数,并且更新参数指针
[*]#define va_end(ap)              (void) 0                                                     // 与va_start成对,避免有些编译器告警
[*]#define va_start(ap, A)         (void) ((ap) = (((char *) &(A)) + (_bnd (A,_AUPBND))))       // 第一个可变形参指针
[*]#endif                /* va_arg */
[*] 
[*]static char sprint_buf;
[*] 
[*]int printf(const char *fmt, ...)
[*]{
[*]    va_list args;
[*]    int n;
[*]    // 第一个可变形参指针
[*]    va_start(args, fmt);
[*]    // 根据字符串fmt,将对应形参转换为字符串,并组合成新的字符串存储在sprint_buf[]缓存中,返回字符个数。
[*]    n = vsprintf(sprint_buf, fmt, args);
[*]    //c尺度要求在同一个函数中va_start 和va_end 要配对的出现。
[*]    va_end(args);
[*]    // 调用相关驱动接口,将将sprintf_buf中的内容输出n个字节到设备,
[*]    // 此处可以是串口、控制台、Telnet等,在嵌入式开辟中可以灵活挂接
[*]    if (console_ops.write)
[*]        console_ops.write(sprint_buf, n);
[*]    return n;
[*]}
可以看到在printf函数中首先使用了可变参数的模式,在函数体内它调用了vsprintf函数(C 尺度库中的一个函数,用于将格式化的数据输出到字符串中),此时它接收一个格式化字符串和一个变长参数列表,并按照格式化字符串的规定将数据格式化为字符串,生成表现信息;接着在判断语句中调用write底层体系函数,将数据从缓冲区写入尺度输出。此时,在 Linux 中,用户空间程序通过软中断或体系调用(int 0x80 或 syscall 指令)切换到内核空间实行体系调用。
字符表现驱动子程序:从ASCII到字模库到表现vram(存储每一个点的RGB颜色信息)。表现芯片按照刷新频率逐行读取vram,并通过信号线向液晶表现器传输每一个点(RGB分量)。
以上是对printf函数的一个简单的分析,可以看到整个过程的关键在于用户程序如何与内核举行交互罢了。
8.4 getchar的实现分析

以下是getchar的代码:

[*]int getchar(void){    
[*]    static char buf;    
[*]    static char *bb = buf;    
[*]    static int n = 0;    
[*]    if(n == 0)    
[*]    {    
[*]        n = read(0, buf, BUFSIZ);    
[*]        bb = buf;    
[*]    }    
[*]   return(--n >= 0)?(unsigned char) *bb++ : EOF;    
[*]}  
它主要是通过调用read函数,将整个缓冲区都读到buf里,当n将缓冲区的长度赋值给n,若n>0,则返回buf的第一个元素,
它会举行异步非常-键盘中断的处理:键盘中断处理子程序。担当按键扫描码转成ascii码,保存到体系的键盘缓冲区。getchar等调用read体系函数,通过体系调用读取按键ascii码,直到担当到回车键才返回。
8.5本章小结

本章主要先容了Linux中I/O的管理方法以及Unix I/O接口和相关的函数,同时简单分析了printf函数以及getchar函数的处理机制。

结论

经过对hello的P2P、020深入探讨,我们可以发现这过程首先由程序员使用高级语言编辑器完成源代码的编写,经过预处理、编译、汇编和链接等步骤,将高级语言代码转化为可实行文件。在运行时,通过fork函数为程序创建子进程,通过MMU举行假造内存地点到物理地点的映射,实行指令,处理信号,最后由父进程回收子进程,开释相关资源,完成程序的生命周期。整个过程涉及预处理、编译、汇编、链接、内存管理、信号处理和进程回收等多个环节。

[*]预处理:将原程序hello.c经过预处理器生成hello.i文件;
[*]编译:编译器将hello.i文件编译为hello.s文件,此刻被替换为汇编内容;
[*]汇编:hello.s文件经过处理变为可重定位目的文件,附有符号表和重定位表;
[*]链接:将可重定位目的文件变为可实行文件,举行符号剖析以及重定位使用;
[*]进程:fork创建hello的进程,execve加载hello并为其完成假造空间的映射;
[*]存储管理:MMU将hello程序中的VA通过页表映射成PA,进而完成内存的分配;
[*]回收:hello结束后shell回收子进程,开释hello所占有的内存。
   深入到场盘算机体系的设计与实现让我深刻领会到体系的复杂性和内涵的协同工作。每个层级的设计决策都影响着整个体系的性能和稳固性,从硬件层面的指令集到使用体系的内存管理和进程调理,再到高级语言的编译和应用层的程序设计,每一环节都需要细致考虑。对体系的深刻理解不但需要掌握广泛的知识,还需要追踪技术的发展动向,以适应不断演进的硬件和软件环境。这个过程中,对于抽象和底层的理解相辅相成,同时也激发了对体系优化和创新的热情。在整个设计与实现的过程中,对盘算机体系的奥妙和奇妙之处有了更深层次的熟悉,也让我深感盘算机科学的魅力和无尽的探索空间。
附件

hello.c
程序原文件
hello.i
预处理(cpp)后生成的文件
hello.s
编译(ccl)后生成的汇编文件
hello.o
汇编(as)后生成的可重定位目的文件
hello
链接后生成的可实行文件
hello.asm
hello.o文件经过objdump生成的反汇编文件
hello.elf
hello.o文件生成的elf文件
Hello.asm
hello文件经过objdump生成的反汇编文件
Hello.elf
hello文件生成的elf文件


参考文献

 林来兴. 空间控制技术. 北京:中国宇航出版社,1992:25-42.
 辛希孟. 信息技术与信息服务国际研讨会论文集:A集. 北京:中国科学出版社,1999.
 赵耀东. 新时代的工业工程师. 台北:天下文化出版社,1998 . http://www.ie.nthu.edu.tw/info/ie.newie.htm(Big5).
 谌颖. 空间交会控制理论与方法研究. 哈尔滨:哈尔滨工业大学,1992:8-13.
  KANAMORI H. Shaking Without Quaking. Science,1998,279(5359):2063-2064.
  CHRISTINE M. Plant Physiology: Plant Biology in the Genome Era. Science,1998,281:331-332. http://www.sciencemag.org/cgi/ collection/anatmorp.
学c的小李.什么是预处理.C语言.Linux.https://blog.csdn.net/LMM1314521/article/details/127431524
安迪西嵌入式.什么是shell,用途是什么.https://blog.csdn.net/Chuangke_Andy/article/details/124891455
Ggggggtm.【Linux从入门到精通】上下文概念详解.https://blog.csdn.net/weixin_67596609/article/details/130669576
octopusHu.逻辑地点、线性地点和物理地点的转换.https://blog.csdn.net/hfut_zhanghu/article/details/122340261
猿来不是梦.C语言Printf函数深入析.C语言Printf函数深入剖析_printf函数原型-CSDN博客
带带刷梧呗.【408条记】使用体系第五章 IO管理.https://blog.csdn.net/weixin_44722861/article/details/127732795


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: CSAPP程序人生-盘算机体系大作业