河曲智叟 发表于 2024-6-28 23:51:40

Linux:进程概念(二.查看进程、父进程与子进程、进程状态详解)

Linux:进程概念(二.查看进程、父进程与子进程、进程状态详解)
上次讲了一下:Linux:冯诺依曼体系结构、操作系统、初识进程


1.查看进程

1.1预备工作

先写好代码:
#include<stdio.h>
#include<unistd.h>

int main()
{
    while(1)
    {
      printf("I'm a process\n");
      sleep(2)
    }//写一个死循环,没两秒打印一次
    return 0;
}

makefile文件也写好:
mycode:code.c
        gcc -o $@ $^ -std=c99
.PHONY:clean
clean
        rm -f mycode
1.2 指令:ps—表现当前系统中运行的进程信息

ps 是一个常用的 Unix/Linux 下令,用于表现当前系统中运行的进程信息。它的名称泉源于 “process status”(进程状态)的缩写。通过 ps 下令,您可以查看正在运行的进程的各种信息,例如进程 ID、CPU 利用环境、内存占用、进程状态等。
常用的 ps 下令选项和参数:
   

[*] -e 或 -A:表现所有进程,等同于 -e。
[*] -f:表现全格式,包括进程的 UID、PID、PPID、C、STIME、TTY、TIME 和 CMD 等信息。
[*] -l:以长格式表现进程信息,包括 UID、PID、PPID、C、PRI、NI、ADDR、SZ、WCHAN、TTY、TIME 和 CMD 等。
[*] -u:以用户格式表现进程信息,包括 USER、PID、%CPU、%MEM、VSZ、RSS、TTY、STAT、START 和 TIME。
[*] -a:表现所有进程,包括其他用户的进程。
[*] -j:以作业格式表现进程信息,包括 PID、PPID、PGID、SID、UID、C、STIME、TTY、TIME 和 CMD 等。
[*] -x:同时表现没有控制终端的进程(保卫进程)。
综合来说,ps -ajx 下令会列出当前系统中所有进程的具体信息,包括进程的作业信息以及其他相干信息。
常见的 ps 下令用法包括:


[*]ps:表现当前用户的正在运行的进程。
[*]ps -ajx :ps -ajx 是一个常用的 Unix/Linux 下令,用于表现当前系统中所有进程的具体信息,并以完备的格式输出
[*]ps -ajx | grep process_name:查找特定进程名的进程。
https://img-blog.csdnimg.cn/direct/c9c604de61584f45a4881348f7e09144.png
   在输出中,第一个进程是你的可执行文件 mycode 的进程,第二个进程是由于你利用了 grep 下令进行字符串匹配而产生的 grep 进程
具体来说:


[*]第一个进程(PID为10995)是你的可执行文件 mycode,它的 PPID(Parent Process ID)是10138,表现它的父进程是PID为10138的进程。
[*]第二个进程(PID为10999)是 grep 下令,它用于搜索包含字符串 “mycode” 的进程。
终止后:
https://img-blog.csdnimg.cn/direct/7cbd6504b1c3469aab66435d51901909.png
1.3查看进程属性

   进程的属性都在task_struct 里,而task_struct是操作系统内部的数据,我们想要访问内部的数据只能通过系统调用
#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
int main()
{
    pid_t id =getpid();
    while(1)
    {
      printf("I'm a process,pid:%d\n",id);
      sleep(2);
    }//写一个死循环,没两秒打印一次
    return 0;
}
   getgid() 函数是一个系统调用,用于获取调用进程的有用组 ID(Group ID)。在 Linux 中,每个进程都属于一个或多个组,getgid() 函数返回调用进程的有用组 ID。其函数原型定义在 <unistd.h> 头文件中:
#include <unistd.h>

gid_t getgid(void);
其中,gid_t 是一个范例,通常是一个无符号整数范例,用于表现组 ID。
1.4通过 /proc 系统文件夹看进程

在Linux系统中,/proc文件系统提供了关于运行中进程的具体信息。你可以通过查看/proc文件系统中的特定目录和文件来获取有关进程的信息。下面是一些你可以在/proc文件系统中找到的有关进程的信息:

[*] /proc/:这是一个以进程ID(PID)命名的目录,其中包含有关特定进程的具体信息。你可以利用下令 ls /proc/ 来查看。
[*] /proc//status:此文件包含有关进程的各种状态信息,例如进程ID、父进程ID、进程状态、内存利用环境等。你可以利用下令 cat /proc//status 查看。
[*] /proc//cmdline:此文件包含启动进程时利用的完备下令行参数。你可以利用下令 cat /proc//cmdline 查看。
[*] /proc//exe:这是一个符号链接,指向正在运行的进程的可执行文件。你可以利用下令 ls -l /proc//exe 查看。
[*] /proc//fd:这是一个目录,包含有关进程打开的所有文件描述符的信息。你可以利用下令 ls /proc//fd 查看。
https://img-blog.csdnimg.cn/direct/b957b8ddacaf4203a627f468c76fa2b6.png
2.父进程与子进程

2.1先容

   在操作系统中,当一个进程(称为父进程)创建另一个新进程(称为子进程)时,父子进程之间创建了一种特殊的关系。这种关系具有以下特点和行为:

[*]父子关系:


[*]子进程的父进程是创建它的进程,即父进程。
[*]每个进程都有唯一的父进程。

[*]PID关系:


[*]子进程的PID(进程标识符)是由父进程调用fork()或类似系统调用创建的。
[*]子进程的PPID(父进程标识符)与创建它的父进程的PID雷同。

[*]资源继续:


[*]子进程继续了父进程的大部分属性和资源,包括内存映像、文件描述符、信号处置惩罚器等。
[*]子进程在创建时拥有父进程的副本,但在其生命周期中可以独立修改这些副本。
几乎所有进程都是由其他进程创建的,因为通常环境下,操作系统启动时会先创建一个初始进程(通常是init进程或systemd),然后其他进程都是由这些初始进程创建的。但是,也有一些特殊环境下的进程,好比内核线程和保卫进程,它们可能是由操作系统内核直接创建的,而不是由其他进程创建的。总体而言,大多数进程都是有其父进程创建的。
2.2getpid() \getppid()

父进程和子进程之间的关系是一个重要的概念,它们之间的关系可以通过系统调用来获取。在Unix/Linux系统中,可以利用 getpid() 系统调用来获取当前进程的PID,利用 getppid() 系统调用来获取当前进程的父进程的PID。
以下是这两个系统调用的扼要分析:


[*] getpid():该系统调用返回调用进程的PID,即当前进程的PID。
[*] getppid():该系统调用返回调用进程的父进程的PID,即当前进程的父进程的PID。
#include <stdio.h>
#include <unistd.h>

int main() {
    pid_t pid = getpid();      // 获取当前进程的PID
    pid_t ppid = getppid();    // 获取当前进程的父进程的PID

    printf("PID: %d\n", pid);
    printf("PPID: %d\n", ppid);

    return 0;
}
2.3 fork()函数—通过系统调用创建进程

   我们要创建一个进程,那一定涉及到访问操作系统的内部数据,肯定也需要利用系统调用
fork 是一个系统调用(也是库函数),用于创建一个新的进程。它会复制调用进程(父进程)的内存和上下文,包括代码段、数据段、堆栈等,然后将这个副本分配给新创建的进程(子进程)。fork 系统调用的原型通常定义在 <unistd.h> 头文件中。
#include <unistd.h>

pid_t fork(void);
   pid_t 是一个范例,用于表现进程 ID,fork 函数返回的是一个 pid_t 范例的值。


[*]fork 调用成功时,在父进程中返回子进程的 PID,而在子进程中返回 0。
[*]假如 fork 调用失败,则返回一个负数,表现错误。
在 fork 调用后,父子进程都会继续执行 fork 调用之后的指令,但是它们会在不同的地点空间中运行,即它们各自拥有独立的内存空间。这意味着,父进程和子进程之间的数据是相互独立的,任何一个进程对内存的修改都不会影响到另一个进程。
父子进程代码共享的原理是采用写时拷贝(copy-on-write)。在 fork 调用后,操作系统并不会立即复制父进程的内存给子进程,而是让父子进程共享同一段内存空间。只有当其中一个进程试图修改共享的内存时,操作系统才会复制该内存页,确保修改不会影响到其他进程。这样做可以节省内存,并提高效率。
fork()函数疑问


[*] 怎么理解fork()是系统调用也是库函数
       fork 在 Unix-like 系统中既是一个系统调用,也是一个库函数,可以这样理解:

[*] 系统调用(System Call):系统调用是操作系统提供给用户空间步伐访问内核功能的一种机制。fork 系统调用是由操作系统内核实现的,用于创建一个新的进程。当用户步伐调用 fork 时,实际上是请求操作系统内核为其创建一个新的进程,这需要通过系统调用来完成。
[*] 库函数:库函数是一组在编程时可调用的函数,这些函数通常包含在标准库或其他库中。在 Unix-like 系统中,C 标准库中包含了对 fork 函数的封装,这意味着用户步伐可以通过调用 fork 库函数来发起对 fork 系统调用的请求,而不必直接调用系统调用。
    从用户步伐的角度来看,fork 可以被视为一个库函数,因为它是通过调用库函数来实现的。
    从操作系统内核的角度来看,fork 是一个系统调用,因为它需要通过内核来创建新的进程。
   
fork 函数在调用后会返回两次,这是因为它是一个复制当前进程的系统调用。下面是对这两个返回值的表明:

[*] 给父进程返回子进程的 PID:在父进程中,fork 返回新创建子进程的进程 ID(PID),这个 PID 是子进程的标识符,父进程通过这个 PID 可以识别并操作子进程。
[*] 给子进程返回 0:在子进程中,fork 也会返回一个值,但是返回的是 0。这是因为在 Unix-like 系统中,子进程是通过复制父进程的地点空间而创建的,因此子进程从父进程继续了大部分的内存结构和数据。为了区分父进程和子进程,fork 在子进程中返回 0,表现这是子进程执行的代码路径。
[*] fork函数为什么会返回两次:fork 函数在调用后会创建一个新的子进程(在return之前就已经创建好子进程了),新的子进程拥有父进程的副本。因此,fork 在执行时会返回两次:一次在父进程中(返回子进程的 PID),另一次在子进程中(返回 0)。这样做是为了让父进程和子进程可以根据返回值来执行不同的代码路径。
利用fork()函数

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
int main()
{
    printf("before fork:I'm a process, pid:%d, ppid:%d\n",getpid(),getppid());
    sleep(1);
    pid_t id=fork();
    if(id<0) return 1;//说明创建失败
    else if(id==0)
    {
      //只有子进程能进这里,我们就可以让子进程做自己的事
      printf("after fork:I'm a child process, pid:%d, ppid:%d\n",getpid(),getppid());
      sleep(2);
    }
    else
    {
      //只有父进程能进这里
      printf("after fork:I'm a father process, pid:%d, ppid:%d\n",getpid(),getppid());
    }
    return 0;
}
3.进程状态

3.1进程列队

   我们首先要知道:进程不是不停在运行的。进程放在了CPU上,也不是不停会运行的,可能在等待某种软硬件资源
而且计算机的资源相对来说不停是不敷的,那么必然出现进程列队的环境,那么列队是怎么个排法呢?


[*]列队是进程的task_struct结构体在列队——放到一个队列里
https://img-blog.csdnimg.cn/direct/199eda81c53648f390a4ff2927688547.png
3.2课本上进程状态的表述——运行、阻塞、挂起

在操作系统中,进程的状态可以分为多种,常见的包括运行、阻塞和挂起。每种状态都对应着一个状态队列,用于存储处于相应状态的进程
   
[*]进程状态的本质:


[*]进程状态通常被表现为整数值,这些整数值定义了进程当前所处的状态。在内核中,进程的状态由一个整型变量表现,通常称为状态字段。不同的操作系统可能会利用不同的状态值和命名,但通常包括就绪、运行、阻塞等状态。

[*]状态决定的后续动作:


[*]进程的状态决定了操作系统对厥后续动作的处置惩罚方式。不同状态的进程可能会有不同的处置惩罚逻辑,以确保系统的正常运行和资源的公道利用。
[*]例如处于运行状态的进程会被分配 CPU 时间片并执行指令;处于阻塞状态的进程会被放入阻塞队列中等待某种事件的发生,如 I/O 操作的完成
运行

   
[*]一个 CPU 一个运行队列:


[*]在操作系统中,为了有用地管理进程的调度和执行,通常会为每个 CPU 维护一个运行队列。这个运行队列存储了当前可运行的进程,即那些已经预备好被 CPU 调度执行的进程。

[*]运行队列结构体定义:


[*]为了管理运行队列,可以定义一个结构体来表现,通常包括两个重要的字段:

[*]num:表现队列中当前的进程数量,即队列长度。
[*]q:一个指针,指向保存了 PCB(Process Control Block,进程控制块)信息的结构体。这个结构体可能是链表或其他数据结构,存储了就绪状态的进程的信息。


[*]已加载到运行队列的含义:


[*]当一个进程被加载到运行队列中时,意味着它已经预备好被 CPU 随时调度执行了。这意味着进程已经完成了一些初始化工作,获取了所需的资源,并且已经被操作系统标记为可执行状态。它随时可以被操作系统的调度器选择,并分配 CPU 时间片来执行其任务。
https://img-blog.csdnimg.cn/direct/e2049fedf7ac4eb8a8e395160a0524b6.png
阻塞

   

[*]当进程需要等待某种事件发生时,例如等待 I/O 操作完成或等待某个信号,它会进入阻塞状态。在阻塞状态下,进程暂时克制执行,让出 CPU 给其他可以执行的进程。
[*]对应的状态队列是阻塞队列,其中存储了因为等待某种事件而被阻塞的进程的信息。一旦等待的事件发生,进程就会从阻塞队列中移出,并重新进入就绪状态,等待 CPU 调度执行。

[*] 阻塞状态有一个阻塞队列,这个队列通常由操作系统维护,用于存放因为等待某种事件而被阻塞的进程。
[*] 阻塞队列通常与特定的硬件装备相干联。例如,假如一个进程等待磁盘 I/O 操作完成,那么它就会被放入磁盘 I/O 队列中。这样,当硬件装备完成相应的操作时,操作系统可以方便地找到并唤醒等待的进程。
[*] 进程进入等待队列确实意味着它被链接到底层装备。这样,当装备就绪并且有了相应的数据或事件时,操作系统可以从等待队列中找到相应的进程,并唤醒它们以继续执行。
[*] 当装备已经就绪时,操作系统会通知相干的进程,告诉它们可以执行了。这个状态由操作系统来管理,因为操作系统可以或许监控硬件装备的状态并作出相应的调度决策。
#include<stdio.h>

int main()
{
    int a=0;
    scnaf("%d",&a);
    printf("%d",a);
    return 0;
}
https://img-blog.csdnimg.cn/direct/6a146d5762b7486e9ee810439a074062.png
   

[*]这段代码中,需要获取软硬件的资源所以进入阻塞状态
[*]阻塞队列(等待队列)是由对应的的硬件提供的,scanf这里就是键盘
[*]进程进入等待队列是把进程链入底层装备的一个过程!
    这个过程:

[*] 当进程执行到 scanf() 函数时,它会尝试从标准输入读取数据。假如标准输入是终端装备(好比键盘),则进程需要等待用户输入数据。此时,操作系统将会将进程状态从运行状态更改为阻塞状态,表现进程暂时无法继续执行,因为它在等待外部事件的发生。
[*] 此时,进程的 task_struct 将从运行队列中移除,并参加到描述键盘的结构中,以便在键盘输入数据后可以或许唤醒这个进程。
[*] 当用户输入数据并按下回车键后,操作系统会将输入的数据传递给进程,并将该进程的状态从阻塞状态更改为就绪状态。接着,进程将重新参加到运行队列中,等待 CPU 的调度执行。
[*] 一旦进程再次被调度到 CPU 上执行,它将继续执行 printf() 函数,并输出用户输入的数据。然后进程执行完成,返回0,最终退出。
挂起

   
[*] 进程进入挂起状态通常是因为系统资源已经极度告急,没有足够的资源来继续运行所有进程。此时,操作系统会将一些不活跃的进程暂时挂起,以开释资源给其他更重要或更活跃的进程利用。
[*] 挂起状态也可以称为阻塞挂起,因为进程在挂起状态下被阻塞,无法执行任何操作,直到被重新唤醒。
[*] 在挂起状态下,操作系统可能会将进程的代码和数据从内存中转移到外部存储装备中,以节省内存空间。这样做的目的是为了开释内存资源,让其他活跃的进程有更多的空间来执行。
[*] 挂起状态的意义在于,通过暂时挂起一些不活跃的进程,可以避免系统资源耗尽导致操作系统崩溃或无法响应。虽然挂起状态可能会导致一些进程的执行速率变慢,但这是为了整个系统的稳定性和可靠性考虑的。
3.3Linux中状态初步认识

   一个进程可以有几个状态(在Linux内核里,进程偶然候也叫做任务)进程的状态通常由几个不同的状态标识符表现。以下是一些常见的进程状态及其在内核源代码中的定义:
static const char* const task_state_array[] =
{
        "R (running)", /* 0 */
        "S (sleeping)", /* 1 */
        "D (disk sleep)", /* 2 */
        "T (stopped)", /* 4 */
        "t (tracing stop)", /* 8 */
        "X (dead)", /* 16 */
        "Z (zombie)", /* 32 */
};
   

[*]R运行状态(running): 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列里。
[*]S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠偶然候也叫做可中断睡眠(interruptible sleep))
[*]D磁盘休眠状态(Disk sleep)偶然候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待IO的结束。
[*]T克制状态(stopped): 可以通过发送 SIGSTOP 信号给进程来克制(T)进程。这个被停息的进程可以通过发送 SIGCONT 信号让进程继续运行。
[*]X殒命状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态
好啦这次就到这里啦!!!也是才结束51假期,渴望51数学建模能拿个不错的奖项吧
感谢大家支持

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: Linux:进程概念(二.查看进程、父进程与子进程、进程状态详解)