ToB企服应用市场:ToB评测及商务社交产业平台

标题: 【网络】传输层协议TCP(重点) [打印本页]

作者: 立山    时间: 2025-2-13 06:17
标题: 【网络】传输层协议TCP(重点)

TCP协议全称为 “传输控制协议(Transmission Control Protocol”)。
人如其名,要对数据的传输进行一个 具体的控制
可靠性:
   
  进步性能:
   
  其他:
   
  1. TCP协议段格式


   
  下面的是Linux源代码中,tcp报头的定义:
  1. struct tcphdr {
  2.     __be16 source;          // 源端口号
  3.     __be16 dest;            // 目的端口号
  4.     __be32 seq;             // 序列号
  5.     __be32 ack_seq;         // 确认号
  6. #if defined(__LITTLE_ENDIAN_BITFIELD)
  7.         //使用了位段
  8.     __u16 res1:4,           // 保留位
  9.           doff:4,           // 数据偏移(头部长度,以32位字为单位)
  10.           fin:1,            // FIN标志:结束连接
  11.           syn:1,            // SYN标志:同步序列号
  12.           rst:1,            // RST标志:重置连接
  13.           psh:1,            // PSH标志:Push函数
  14.           ack:1,            // ACK标志:确认字段有效
  15.           urg:1,            // URG标志:紧急指针字段有效
  16.           ece:1,            // ECN回显标志
  17.           cwr:1;            // 拥塞窗口减少标志
  18. #elif defined(__BIG_ENDIAN_BITFIELD)
  19.     __u16 doff:4,           // 数据偏移(头部长度,以32位字为单位)
  20.           res1:4,           // 保留位
  21.           cwr:1,            // 拥塞窗口减少标志
  22.           ece:1,            // ECN回显标志
  23.           urg:1,            // URG标志:紧急指针字段有效
  24.           ack:1,            // ACK标志:确认字段有效
  25.           psh:1,            // PSH标志:Push函数
  26.           rst:1,            // RST标志:重置连接
  27.           syn:1,            // SYN标志:同步序列号
  28.           fin:1;            // FIN标志:结束连接
  29. #else
  30. #error "Adjust your <asm/byteorder.h> defines"
  31. #endif
  32.     __be16 window;          // 窗口大小
  33.     __sum16 check;          // 校验和
  34.     __be16 urg_ptr;         // 紧急指针
  35. };
复制代码
2. 详解TCP

2.1 4位首部长度

4位首部长度 = 尺度报头长度 + 选项长度,单位是4字节。
4个比特位可表示的范围是 [0,15],可表示的巨细就是 [0,60]字节,由于尺度报头占 20 字节,以是4位首部长度的范围是 [20,60]。

以是,TCP解包时,先读取报文的前20字节,然后再根据4位首部长度,将报头+选项提取出来,剩下的就是有效载荷的长度。
2.2 32位序号与32位确认序号(确认应答机制)

起首我们要知道,32位序号是用来保证收到的报文的可靠性的(对汗青报文的可靠性)。
TCP中的可靠性主要是依赖确认应答实现的,否则发送方不知道自己发送的报文是否被收到了。
只要发送端收到了应答,阐明发送的数据一定被收到了,可靠性也就保证了。(接收端无需关心自己的应答是否可靠,如果不可靠,发送端会重发数据;如果可靠,发送端就发新的数据了)
那什么是确认呢?
   确认,至少是一个“裸”的tcp报头
  32位序号又是什么呢?
根据我们上面所说的,一条请求对应一条应答,没有收到应答就会重新发送请求;如果是串行的话,服从就太低了,以是TCP选择的是并行发送。

并行发送会存在一个题目,不知道应答对应哪一条请求,以是必须对请求编号,这个编号就是32位序号
32位确认序号就是对报文的序号+1,表示序号之前的内容已经收到了
序号与确认序号不一定是一对一的,多个序号可能只会有一条确认序号,表示该序号之前的内容已全部收到)
   序号存在的另一个缘故原由:保证报文的按序到达
报文如果到达后是乱序的,这也是不可靠的的表现,以是可以根据序号排序,然后按顺序入缓冲区。
  可是报头中为什么要有两个32位序号呢?一个也够用呀?
   两个32位序号,是为了实现捎带应答机制。接收端应答的同时,也想捎带着给发送端发送数据。
以是,TCP报文在很大概率上,既是应答,也是数据。
  那序号又是如何产生的呢?

2.3 超时重传机制


主机 A 发送数据给 B 之后,可能由于网络拥堵等缘故原由,数据无法到达主机 B;如果主机 A 在一个特定时间隔断内没有收到 B 发来的确认应答,就会进行重发;
但是,主机 A 未收到 B 发来的确认应答, 也可能是由于应答丢失

因此主机 B 会收到很多重复数据。那么 TCP 协议需要能够辨认出那些包是重复的包, 而且把重复的丢弃掉。
这时候我们可以使用前面提到的序列号, 就可以很容易做到去重的效果。
以是,为了低落重复率,不能让发送方不绝发,需要设定一个时间,超过这个时间后,发送端再发,这种机制叫做超时重传机制。
那超时的时间如何确定呢?
   
  TCP 为了保证无论在任何环境下都能比较高性能的通信,因此会动态计算这个最大超时时间
Linux 中(BSD Unix 和 Windows 也是如此),超时以 500ms 为一个单位进行控制,每次判定超时重发的超时时间都是 500ms 的整数倍。
   
  2.4 毗连管理机制(3次握手、4次挥手 + 3个标志位)

在正常环境下,TCP 要颠末三次握手建立毗连,四次挥手断开毗连。

在正式学习握手、挥手之前,先相识报头中的几个标志位。
在TCP报头中,有6个标志位,用来区分接收端收到的TCP报文的类型 (可能有多个发送端)。

表明自己是一个确认报文,让对方关心确认序号。 (由于有捎带应答机制,以是大部分的TCP报文的ACK标志位都为1)
同步标志位,即表明是一个建立毗连的请求
表明自己是一个断开毗连的请求,一般用于通信结束时。

两边建立毗连,起主要进行3次握手
   举个栗子:
男:你愿意做我女朋侪吗?
女:好呀,什么时候开始?
男:就现在!
  在上面的例子中,两边用了最小的握手次数,建立了关系,这就叫做三次握手

两边断开毗连,起主要进行4次挥手
   举个栗子:
女:我们分手吧!
男:好!
男:我也要跟你分手!
女:好!
  为什么叫做四次挥手? - 由于断开毗连需要征得两边的同意 ! (由于TCP是全双工的,要关闭两个朝向上的毗连)


3次握手,是由操作体系自动完成的。
服务器端:accept返回后,毗连已经建立完成了。即accept等3次握手完成,它不参与3次握手。
客户端:connect调用后,触发操作体系,让操作体系发送SYN,两边握手完成,connect返回。
   
  有了四次挥手的理解,3次握手的本质,其实也是四次握手!

以是,为什么要3次握手呢?
谈了这么多,到底什么是毗连呢?
   
  
下面我们再来看一下4次挥手

介绍一个体系调用,shutdown可控制关闭毗连的读写端

我们具体是使用close照旧shutdown,取决于应用层。
在服务器这边,如果不调用close关闭sockfd,那就只会进行两次挥手,server会不绝处于close_wait状态,会造成文件形貌符走漏、内存走漏题目。
当服务器关闭后,server会进入last_ack状态,可是此时客户端早就关闭了,没人给它应答了,那么服务端在一段时间后,自动进入closed状态。
那客户端的time_wait状态是什么意思呢??
   
  为什么会这样呢?举个例子:
  
  等候2MSL的目的是:
  
  为什么是2MSL呢?MSL不可吗?
   
  在我们前面写代码时,端口号绑定失败的缘故原由:
   
  可以通过 cat /proc/sys/net/ipv4/tcp_fin_timeout 检察 msl 的值

2.5 16位窗口巨细(流量控制)

接收端处理数据的速度是有限的。如果发送端发的太快,导致接收端的缓冲区被打满,这个时候如果发送端继续发送,就会造成丢包,继而引起丢包重传等等一系列连锁反应,不做任何处理则会浪费了各种资源(网络带宽、CPU等等)。
因此 TCP 支持根据接收端的处理本领,来决定发送端的发送速度,这个机制就叫做流量控制
   接收端将自己可以接收的缓冲区巨细放入 TCP 首部中的 “窗口巨细” 字段
  
  

接收端如何把窗口巨细告诉发送端呢? TCP 首部中,有一个 16 位窗口巨细字段,就是存放了窗口巨细信息(即自己接收缓冲区中剩余空间的巨细);
   那么题目来了,16 位数字最大表示 65535, 那么 TCP 窗口最大就是 65535 字节么?
实际上,TCP 首部 40 字节选项中还包含了一个窗口扩大因子 M,实际窗口巨细是窗口字段的值左移 M 位;
  2.6 滑动窗口

在我们讨论了确认应答策略时, 对每一个发送的数据段,都要给一个 ACK 确认应答,收到 ACK 后再发送下一个数据段(串行发送)。
这样做有一个比较大的缺点:就是性能较差,尤其是数据往返的时间较长的时候。
我们说TCP是采用并行发送的,它是怎么实现的呢?流量控制又是怎么实现的呢? - - 滑动窗口
窗口巨细指的是:无需等候确认应答就可以继续发送数据的最大值。 下图的窗口巨细就是 4000 个字节(四个段)
   
  

此时就是并行发送的了

那么如果出现了丢包,如何进行重传?这里分两种环境讨论:

这种环境下, 部分 ACK 丢了并不要紧,由于可以通过后续的 ACK 进行确认;

当某一段报文段丢失之后,发送端会不绝收到 1001 这样的 ACK,就像是在提示发送端 “我想要的是 1001” 一样,滑动窗口会先向右移动到已经发送成功处,然后补发丢失的报文。
   
  既然有了快重传,它既快,又能重传,那为什么还要超时重传呢?
   快重传是有条件的:要一连三次收到同一个应答!
万一发送方只发送了2个报文呢?最多就只能收到2个应答呗,那就无法触发快重传,只能超时重传。以是,超时重传是兜底的;快重传是进步服从的。
  2.7 3个标志位 + 16位紧急指针

有了上面的理解,我们来相识一下TCP报头中剩余的3个标志位
在进行流量控制时,如果接收方的缓冲区已满,那发送方也就只能发送探测报文,没有别的办法了。
为了告诉对方,请尽快将缓冲区中的数据交给上层,就引入了PSH标志位;也可使用PSH标志位,告诉对端,我的数据比较重要,请尽快交付。
重置毗连(重新三次握手)
在三次握手时,服务端未收到ACK,但发送端以为毗连建立成功了,发送端此时就会发送数据,但是服务端不熟悉它,会通过标志位RST要求重新建立毗连。
表示紧急报文,优先让上层从缓冲区中读取。
那紧急数据在那里呢?
在TCP报头中,有16位紧急指针,表示紧急数据在有效载荷中的偏移量,通过它就可以获取紧急数据。
但是只有紧急数据的起始地点,紧急数据有多长呢?
TCP答应插队,但不答应过度插队, 紧急数据只占一个字节! 以后可以在紧急数据中设置状态码(如终止毗连、暂停上传等等)
   在体系调用recv中,可以设置标志位MSG_OOB,来读取紧急数据。
  2.8 拥塞控制

固然 TCP 有了滑动窗口这个大杀器,能够高效可靠的发送大量的数据,但是如果在刚开始阶段就发送大量的数据,仍旧可能引发题目。
由于网络上有很多的计算机,可能当前的网络状态就已经比较拥堵。在不清晰当前网络状态下,贸然发送大量的数据,是很有可能引起雪上加霜的。 以是TCP使用拥塞控制来考虑网络的康健状况, 一旦发送的报文大量丢失,则会被判定为网络拥塞。
   大量报文丢失后,能不能直接重传呢?- - - 不能,由于可能会造成网络更加的拥堵!应该等一等
  TCP 引入慢启动机制,先发少量的数据,探探路,摸清当前的网络拥堵状态,再决定按照多大的速度传输数据。

此处引入一个拥塞窗口的概念,拥塞窗口是衡量网络拥堵的指标。

滑动窗口 = min (拥塞窗口,对端接收缓冲区剩余空间的巨细)
像上面这样的拥塞窗口增长速度,是指数级别的。“慢启动” 只是指初使时慢,但是增长速度非常快 (指数级增长)。
   可是为什么使用指数级增长呢?
指数增长的特点是:前期慢,后期快;既然前面慢速度发送的都没有题目,那就应该尽快进行网络的规复。
  但是,为了不增长的那么快,不能使拥塞窗口单纯的加倍;此处引入一个叫做慢启动的阈值,当拥塞窗口超过这个阈值的时候,不再按照指数方式增长,而是按照线性方式增长

拥塞控制算法 = 慢启动 + 加法增大 + 乘法减小
可是这个拥塞窗口为什么不绝在试探性的增大呢?
   拥塞窗口是网络康健状况的评估值,网络的状况是不绝在变化的,以是要反复的试探,只管让下一次的阈值高一点。
  拥塞控制,归根结底是 TCP 协议想尽可能快的把数据传输给对方,但是又要避免给网络造成太大压力的折中方案。
2.9 延迟应答

接收端收到数据后,如果接收数据的主机立即返回 ACK 应答,这时候返回的窗口可能比较小(上层未取走刚接收到的报文)

那么全部的包都可以延迟应答么? 肯定也不是
   
  

2.10 其它

2.10.1 面向字节流

创建一个 TCP 的 socket,同时在内核中创建一个 发送缓冲区 和一个 接收缓冲区
   
  由于缓冲区的存在, TCP 程序的读和写不需要一一匹配,比方:
   
  2.10.2 粘包题目

起主要明确,粘包题目中的 “包” ,是指的应用层的数据包。
   
  那么如何避免粘包题目呢? 归根结底就是一句话,明确两个包之间的界限
   
  思索: 对于 UDP 协议来说,是否也存在 “粘包题目” 呢?
   
  2.10.3 异常环境


3. TCP/UDP 对比

我们说了 TCP 是可靠毗连,那么是不是 TCP 一定就优于 UDP 呢? TCP 和 UDP 之间的优点和缺点。不能简单、绝对的进行比较

归根结底,TCP 和 UDP 都是程序员的工具,什么时机用,具体怎么用,照旧要根据具体的需求场景去判定
   
   先根据应用场景,确定具体的应用需求,可靠性要保障到什么程度;再参考 TCP 的可靠性机制, 在应用层实现雷同的逻辑;
   
  


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4