慢吞云雾缓吐愁 发表于 2024-8-19 20:11:43

【Linux】线程的概念

前言:
本节我们将进入Linux系统编程中多线程的学习,相识线程概念,理解线程与历程区别与接洽…


1.线程概念

在之前的Linux学习中,学习了历程的相关概念,操作系统内核中的task_struct描述历程,CPU在运行时,会根据时间片轮询调治历程,让每个历程得以推进。


[*]每个历程的PCB结构都可以看待一整个历程地址空间,以前学的历程是一个PCB对应一个历程地址空间。
[*]线程可以理解为轻量级历程,每一个历程都可以创建多个限制,并实行不同的代码。
https://i-blog.csdnimg.cn/direct/374e2febb6264bfc96762884956057ca.png


[*]线程在历程内部实行,是OS调治的根本单位。。(在历程的地址空间内运行)
线程的区别点
1.不再分配独立的地址空间。
2.不再分配独立的页表,而是所有PCB指向同一地址空间,以致未来访问同一张页表。
3.CPU看待历程和线程是一样的,调治的时候,都是以task_struct为单位来调治的。
1.1 Linux系统和Windows系统上线程实现的区别:

Windows系统中:


[*]是真线程的操作系统, 分Pcb (Process Control Block) 和tcb (Thread Control Block)
[*]在真正的线程操作系统中,TCB (Thread Control Block)和PCB(Process Control Block)是分开实现的。
Linux系统中:


[*]是用历程模拟的Pcb来模拟的,linux系统中计划了单独的线程lib库(Pthread) ,来进行线程的操作
[*]Linux没有提供,纯创建线程的系统调用接口。由于底层没有用真线程,用的是Lib库来模拟操作的。
[*]历程和线程在概念上没有区分,用的都是task_struct。
为什么线程切换本钱比较低?
(1)虚拟地址空间不需要切换 (2)页表不需要切换
1.2 线程的优缺点:



[*] 线程的优点
[*] 创建一个新线程的代价 要比创建一个新历程小的多。
[*] 与历程的切换相比,**线程之间的切换需要操作系统做的工作要少的多。
[*] 线程占用的资源要比历程少很多
[*] 能充分利用多处理器的可并行数量
[*] 在等候慢速I/O操作竣事的同时,步伐可实行其他的计算使命
[*] 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
[*] I/O密集型应用,为了进步性能,将I/O操作重叠。线程可以同时等候不同的I/O操作
[*] 线程的缺点

[*]性能损失。
假如计算密集型线程的数量比可用的处理器多,那么大概会有较大的性能损失,这里的性能损失指的是增加了额外的
同步和调治开销,而可用的资源稳定。
2. 健壮性降低
编写多线程需要更全面更深入的考虑,在一个多线程步伐里,因时间分配上的细微偏差或者因共享了
不该共享的变量而造成不良影响的大概性是很大的,换句话说线程之间是缺乏保护的
3. 缺乏访问控制
假如多线程都去调用某些OS函数,会对整个历程造成影响。
4.编程难度进步
编写与调试一个多线程步伐比单线程步伐困难得多
1.3 线程异常:



[*]单个线程假如出现除零,野指针问题导致线程瓦解,历程也会随着瓦解
[*]线程是历程的实行分支,线程出异常,就类似历程出异常,进而触发信号机制,停止历程,历程停止,该
历程内的所有线程也就随即退出
线程用途


[*]合理的利用多线程,能进步CPU密集型步伐的实行服从
[*]合理的利用多线程,能进步IO密集型步伐的用户体验(如生活中我们一边写代码一边下载开辟工具,就是 多线程运行的一种表现)
1.4 Linux历程与线程的区别:



[*]历程是资源分配的根本单位
[*] 线程是调治的根本单位
[*]线程共享历程数据,但也拥有自己的一部门数据(独享的):
   

[*]线程ID
[*]一组寄存器
[*]栈
[*]errno
[*]信号屏蔽字
[*]调治优先级
线程共享历程的地址空间,因此文本段、数据段都是共享的。
假如定义一个函数,在各线程中都可以调用。。
假如定义一个全局变量,在各线程都可以访问到。。
   文件描述符表
每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
当前工作目录
用户id和组id
https://i-blog.csdnimg.cn/direct/f4cce75d028a45569feea98ca03d78bc.png
2. 线程的函数

POSIX线程库


[*]与线程有关的函数构成了一个完整的系列,绝大多数函数的名字都是以“pthread_”打头的
[*]利用时,要通过引入头文<pthread.h>
[*]链接时,这些线程函数库时要利用编译器命令的“-lpthread”选项
2.1 线程的创建

Linux中没有原生创建线程的接口,应用级步伐员帮我们开辟出了一批接口, 叫做pthread_create。叫做原生线程库
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *
(*start_routine)(void*), void *arg);
参数
thread:返回线程ID
attr:设置线程的属性,attr为NULL表示使用默认属性
start_routine:是个函数地址,线程启动后要执行的函数
arg:传给线程启动函数的参数,它是一个void类型的指针,可以传递任意类型的数据给线程函数。。。
返回值:成功返回0;失败返回错误码
留意:


[*]在现在所有主流的Linux版本中,都默认带这个库,是原生的,在操作系统中就存在的。
[*]不是所谓的系统调用接口,是库函数。
[*]传统的一些函数是,乐成返回0,失败返回-1,并且对全局变量errno赋值以指示错误。
pthreads函数出错时不会设置全局变量errno(而大部门其他POSIX函数会如许做)。而是将错误代码通
过返回值返回
补充知识点:


[*]pthread_ create函数会产生 一个线程ID【pthread_t 】,存放在第一个参数指向的地址中。该线程ID和前面说的线程ID不是一回事
[*] 前面讲的线程ID属于历程调治的范畴。由于线程是轻量级历程,是操作系统调治器的最小单位,以是需要一个数值来唯一表现该线程
[*]线程库NPTL提供了pthread_ self函数,可以获得线程自身的ID.
[*]pthread_ create函数第一个参数指向一个虚拟内存单元,该内存单元的地址即为新创建线程的线程ID,
属于NPTL线程库的范畴。线程库的后续操作,就是根据该线程ID来操作线程的
2.2 pthread_t 线程ID的先容

pthread_t pthread_self(void);
%可用于获取线程库对应的线程ID
pthread_t 到底是什么类型呢?
   pthread_t类型的线程ID,本质就是一个历程地址空间上的一个地址
https://i-blog.csdnimg.cn/direct/2de996e6943d4e44b02c7262bb92f784.png
2.3 线程的停止

假如需要只停止某个线程,而不停止整个历程,有以下三种方法:
   1.从线程函数Return .这种方法对主线程不适用(由于从main函数return,相称于调用了exit,整个历程都退出了)
2.线程可以调用pthread_ exit停止自己
3.一个线程可以调用pthread_ cancel,停止同一历程中的另一个线程。
void pthread_exit(void *value_ptr);
参数
value_ptr:value_ptr不要指向一个局部变量。
返回值:无返回值,跟进程一样,线程结束的时候无法返回到它的调用者(自身)
需要留意,pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的,不能在线程函
数的栈上分配,由于当别的线程得到这个返回指针时线程函数已经退出了
pthread_cancel函数:
功能:取消一个执行中的线程
原型
int pthread_cancel(pthread_t thread);
参数
thread:线程ID
返回值:成功返回0;失败返回错误码
2.4 线程等候

为什么需要线程等候?
   已经退出的线程,其空间没有被释放,仍然在历程的地址空间内。
创建新的线程不会复用刚才退出线程的地址空间
线程退出的时候,一般必须要进行join,假如不进行join:


[*]就会造成类似于历程那样的内存走漏的问题(没有僵尸线程如许的说法)
[*]线程对应的退出结果暂时不获取
int pthread_join(pthread_t thread, void **value_ptr);
参数
thread:线程ID
value_ptr:它指向一个指针,后者指向线程的返回值,是输出型参数
返回值:成功返回0;失败返回错误码
调用该函数的线程将挂起等候,直到id为thread的线程停止。thread线程以不同的方法停止,通过pthread_join得到的
停止状态是不同的.
   
[*]假如thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。
[*]假如thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数 PTHREAD_ CANCELED。
[*]假如thread线程是自己调用pthread_exit停止的,value_ptr所指向的单元存放的是传给pthread_exit的参 数。
[*]假如对thread线程的停止状态不感兴趣,可以传NULL给value_ ptr参数
2.5 分离线程



[*]默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_join操作,否则无法释放资源,从而造成系统走漏。
[*]假如不关心线程的返回值,join是一种负担,这个时候,我们可以告诉系统,当线程退出时,自动释放线程资源.
int pthread_detach(pthread_t thread);
可以是线程组内其他线程对目的线程进行分离,也可以是线程自己分离。
pthread_detach(pthread_self());
   留意:joinable和分离是辩论的,一个线程不能既是joinable又是分离的
3 查看线程

代码演示:
#include <iostream>
#include <string>
#include <unistd.h>
// #include <pthread.h>
#include <thread> // C++11的线程库
using namespace std;
void* callback1(void* args)
{
    string name = (char*)args;
    while (true)
    {
      cout << name << ": " << ::getpid() << endl;
      sleep(1);
    }
}
void* callback2(void* args)
{
    string name = (char*)args;
    while (true)
    {
      cout << name << ": " << ::getpid() << endl;
      sleep(1);
    }
}

int main()
{
    // std::thread t([](){
    //   while(true)
    //   {
    //         cout << "线程运行起来啦" << endl;
    //         sleep(1);
    //   }
    // });

    // 等待就可以了
    // t.join();

    pthread_t tid1;
    pthread_t tid2;
    pthread_create(&tid1, nullptr, callback1, (void*)"thread 1");
    pthread_create(&tid2, nullptr, callback2, (void*)"thread 2");

    while (true)
    {
      cout << "我是主线程...: " << ::getpid() << endl;
      sleep(1);
    }
    pthread_join(tid1, nullptr);
    pthread_join(tid2, nullptr);

    return 0;
}
3.1 ps -aL:

https://i-blog.csdnimg.cn/direct/8aaa088535e24444a38ffcf93200b94a.png


[*]在Linux中, LWP的缩写代表Lightweight Process,它意味着轻量级历程。
[*]假如LWP和PID是相等的,那么就是主线程,俗称历程。
[*]三个实行流的PID是一样的,说明是在同一个历程内的三个实行流。
4 页表的认识

字符常量不可被修改曾经是怎么加载到内存中的呢?
   

[*]字符常量不可被修改,修改的话,编译不会报错,但是运行时报错了。
[*]是由于当尝试着去修改时候,页表里有对应的条目,会限制进行读写。
https://i-blog.csdnimg.cn/direct/298ea90763f24af983513ca28635c49e.png
尾声
看到这里,相信各人对这个Linux 有相识了。
假如你感觉这篇博客对你有帮助,不要忘了一键三连哦

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 【Linux】线程的概念