北冰洋以北 发表于 2024-8-16 14:31:33

RTP封装&h264原理&实现传输h264的RTSP服务器

媒介

实现:客户端建立与RTSP服务端的连接后,并且在RTSP服务端回复了客户端的Play请求以后,服务端必要源源不断的读取一个本地h264视频文件,并将读取到的h264视频流封装到RTP数据包中,再推送至客户端。这样我们就实现了一个简单的支持RTSP协议流媒体分发服务。
一、RTP封装

https://img-blog.csdnimg.cn/direct/09046a7838214bbca3d95fc5f0d42526.png

[*]RTP头的结构体
struct RtpHeader
{
    /* byte 0 */
    uint8_t csrcLen : 4;//CSRC计数器,占4位,指示CSRC 标识符的个数。
    uint8_t extension : 1;//占1位,如果X=1,则在RTP报头后跟有一个扩展报头。
    uint8_t padding : 1;//填充标志,占1位,如果P=1,则在该报文的尾部填充一个或多个额外的八位组,它们不是有效载荷的一部分。
    uint8_t version : 2;//RTP协议的版本号,占2位,当前协议版本号为2。

    /* byte 1 */
    uint8_t payloadType : 7;//有效载荷类型,占7位,用于说明RTP报文中有效载荷的类型,如GSM音频、JPEM图像等。
    uint8_t marker : 1;//标记,占1位,不同的有效载荷有不同的含义,对于视频,标记一帧的结束;对于音频,标记会话的开始。

    /* bytes 2,3 */
    uint16_t seq;//占16位,用于标识发送者所发送的RTP报文的序列号,每发送一个报文,序列号增1。接收者通过序列号来检测报文丢失情况,重新排序报文,恢复数据。

    /* bytes 4-7 */
    uint32_t timestamp;//占32位,时戳反映了该RTP报文的第一个八位组的采样时刻。接收者使用时戳来计算延迟和延迟抖动,并进行同步控制。

    /* bytes 8-11 */
    uint32_t ssrc;//占32位,用于标识同步信源。该标识符是随机选择的,参加同一视频会议的两个同步信源不能有相同的SSRC。

   /*标准的RTP Header 还可能存在 0-15个特约信源(CSRC)标识符
   
   每个CSRC标识符占32位,可以有0~15个。每个CSRC标识了包含在该RTP报文有效载荷中的所有特约信源

   */
};


[*]RTP包的结构体
struct RtpPacket
{
    struct RtpHeader rtpHeader;
    uint8_t payload;
};
// 包含一个RTP头部和RTP载荷

二、H264码流举行RTP封装

1.明白H264编码

H.264由一个一个的NALU组成,每个NALU之间使用00 00 00 01或00 00 01分隔开,每个NALU的第一次字节都有特别的寄义,
https://img-blog.csdnimg.cn/direct/178fddab4f764a24ae2fd0c387ce2dfe.png
https://img-blog.csdnimg.cn/direct/58b19d66b09749938de11f21c00ea84d.png

[*]F(forbiden):克制位,占用NAL头的第一个位,当克制位值为1时表现语法错误;
[*]NRI:参考级别,占用NAL头的第二到第三个位;值越大,该NAL越紧张。
[*]Type:Nal单元数据范例,也就是标识该NAL单元的数据范例是哪种,占用NAL头的第四到第8个位;
常用Nalu_type:
0x06 (0 00 00110) SEI      type = 6
0x67 (0 11 00111) SPS      type = 7
0x68 (0 11 01000) PPS      type = 8

0x65 (0 11 00101) IDR      type = 5
0x65 (0 10 00101) IDR      type = 5
0x65 (0 01 00101) IDR      type = 5
0x65 (0 00 00101) IDR      type = 5

0x61 (0 11 00001) I帧      type = 1
0x41 (0 10 00001) P帧      type = 1
0x01 (0 00 00001) B帧      type = 1
对于H.264格式了解这些就够了,目标是想从一个H.264的文件中将一个一个的NALU提取出来,然后封装成RTP包,下面介绍如何将NALU封装成RTP包。
2.H.264打包

H.264可以由三种RTP打包方式

[*] 单NALU打包: 一个RTP包包含一个完备的NALU
[*] 聚合打包:对于较小的NALU,一个RTP包可包含多个完备的NALU
[*] 分片打包:对于较大的NALU,一个NALU可以分为多个RTP包发送
注意:这里要区分好概念,每一个RTP包都包含一个RTP头部和RTP荷载,这是固定的。而H.264发送数据可支持三种RTP打包方式
比较常用的是单NALU打包和分片打包,这里只介绍两种
单NALU打包
所谓单NALU打包就是将一整个NALU的数据放入RTP包的载荷中,这是最简单的一种方式。
分片打包
每个RTP包都有巨细限制的,因为RTP一般都是使用UDP发送,UDP没有流量控制,所以要限制每一次发送的巨细,所以假如一个NALU的太大,就必要分成多个RTP包发送,至于如何分成多个RTP包,如下:
首先要明白,RTP包的格式是绝不会变的,永远多是RTP头+RTP载荷
https://img-blog.csdnimg.cn/direct/cb6a8ab078cc4f8ebd5a6fa486bde4a1.png
RTP头部是固定的,那么只能在RTP载荷中去添加额外信息来说明这个RTP包是表现同一个NALU
假如是分片打包的话,那么在RTP载荷开始有两个字节的信息,然后再是NALU的内容
https://img-blog.csdnimg.cn/direct/6b638b581c9a4b44b61bd8cbfb67be78.png
第一个字节位FU Indicator,其格式如下
https://img-blog.csdnimg.cn/direct/464c3f95e72045c187fbcba7a76a02bb.png
高三位:与NALU第一个字节的高三位雷同
Type:28,表现该RTP包一个分片,为什么是28?因为H.264的规范中定义的,别的还有许多其他Type,这里不详讲
第二个字节位FU Header,其格式如下
https://img-blog.csdnimg.cn/direct/60cd7b7dab9846b0833933a52b21d2f8.png
S:标记该分片打包的第一个RTP包
E:比较该分片打包的末了一个RTP包
Type:NALU的Type
三、实现一个传输h264的RTSP服务器

代码如下:
main.cpp

//
// Created by sun on 10/11/21.
//

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <string.h>
#include <time.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <WinSock2.h>
#include <WS2tcpip.h>
#include <windows.h>
#include "rtp.h"

#define H264_FILE_NAME   "../data/test.h264"
#define SERVER_PORT      8554
#define SERVER_RTP_PORT55532
#define SERVER_RTCP_PORT 55533
#define BUF_MAX_SIZE   (1024*1024)

static int createTcpSocket()
{
    int sockfd;
    int on = 1;

    sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd < 0)
      return -1;

    setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, (const char*)&on, sizeof(on));

    return sockfd;
}

static int createUdpSocket()
{
    int sockfd;
    int on = 1;

    sockfd = socket(AF_INET, SOCK_DGRAM, 0);
    if (sockfd < 0)
      return -1;

    setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, (const char*)&on, sizeof(on));

    return sockfd;
}

static int bindSocketAddr(int sockfd, const char* ip, int port)
{
    struct sockaddr_in addr;

    addr.sin_family = AF_INET;
    addr.sin_port = htons(port);
    addr.sin_addr.s_addr = inet_addr(ip);

    if (bind(sockfd, (struct sockaddr*)&addr, sizeof(struct sockaddr)) < 0)
      return -1;

    return 0;
}

static int acceptClient(int sockfd, char* ip, int* port)
{
    int clientfd;
    socklen_t len = 0;
    struct sockaddr_in addr;

    memset(&addr, 0, sizeof(addr));
    len = sizeof(addr);

    clientfd = accept(sockfd, (struct sockaddr*)&addr, &len);
    if (clientfd < 0)
      return -1;

    strcpy(ip, inet_ntoa(addr.sin_addr));
    *port = ntohs(addr.sin_port);

    return clientfd;
}

static inline int startCode3(char* buf)
{
    if (buf == 0 && buf == 0 && buf == 1)
      return 1;
    else
      return 0;
}

static inline int startCode4(char* buf)
{
    if (buf == 0 && buf == 0 && buf == 0 && buf == 1)
      return 1;
    else
      return 0;
}

static char* findNextStartCode(char* buf, int len)
{
    int i;

    if (len < 3)
      return NULL;

    for (i = 0; i < len - 3; ++i)
    {
      if (startCode3(buf) || startCode4(buf))
            return buf;

      ++buf;
    }

    if (startCode3(buf))
      return buf;

    return NULL;
}

static int getFrameFromH264File(FILE* fp, char* frame, int size) {//从H.264 文件中读取一帧视频数据
    int rSize, frameSize;   // rSize:读取到的数据大小,frameSize:帧数据的大小
    char* nextStartCode;    // nextStartCode:指向下一个起始码的指针

    if (!fp)
      return -1;

    rSize = fread(frame, 1, size, fp);

    if (!startCode3(frame) && !startCode4(frame))
      return -1;

    nextStartCode = findNextStartCode(frame + 3, rSize - 3);
    if (!nextStartCode)
    {
      //lseek(fd, 0, SEEK_SET);
      //frameSize = rSize;
      return -1;
    }
    else
    {
      frameSize = (nextStartCode - frame);    // 如果找到 计算帧长度
      fseek(fp, frameSize - rSize, SEEK_CUR); // 返回原来位置

    }

    return frameSize;   // 返回帧长度
}
/*
serverRtpSockfd: 服务器 RTP 套接字文件描述符; ip: 客户端 IP 地址; port: 客户端 RTP 端口
rtpPacket: RTP 包结构体,用于存储 RTP 头和负载; frame: H.264 视频帧数据; frameSize: 视频帧大小
*/
static int rtpSendH264Frame(int serverRtpSockfd, const char* ip, int16_t port,
    struct RtpPacket* rtpPacket, char* frame, uint32_t frameSize)
{

    uint8_t naluType;   // nalu第一个字节,用于指示 NALU 类型
    int sendBytes = 0;// 已发送的字节数
    int ret;

    naluType = frame;    // 获取 NALU 类型

    printf("frameSize=%d \n", frameSize);

    if (frameSize <= RTP_MAX_PKT_SIZE) // nalu长度小于最大包长:单一NALU单元模式
    {

         //*   0 1 2 3 4 5 6 7 8 9
         //*+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         //*|F|NRI|Type   | a single NAL unit ... |
         //*+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

      memcpy(rtpPacket->payload, frame, frameSize);   // 将帧数据复制到 RTP 负载中
      ret = rtpSendPacketOverUdp(serverRtpSockfd, ip, port, rtpPacket, frameSize);
      if(ret < 0)
            return -1;

      rtpPacket->rtpHeader.seq++;
      sendBytes += ret;
      if ((naluType & 0x1F) == 7 || (naluType & 0x1F) == 8) // 如果是SPS、PPS就不需要加时间戳
            goto out;
    }
    else // nalu长度小于最大包场:分片模式
    {

         //*0                   1                   2
         //*0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3
         //* +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         //* | FU indicator|   FU header   |   FU payload   ...|
         //* +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+



         //*   FU Indicator
         //*    0 1 2 3 4 5 6 7
         //*   +-+-+-+-+-+-+-+-+
         //*   |F|NRI|Type   |
         //*   +---------------+



         //*      FU Header
         //*    0 1 2 3 4 5 6 7
         //*   +-+-+-+-+-+-+-+-+
         //*   |S|E|R|Type   |
         //*   +---------------+


      int pktNum = frameSize / RTP_MAX_PKT_SIZE;       // 有几个完整的包
      int remainPktSize = frameSize % RTP_MAX_PKT_SIZE; // 剩余不完整包的大小
      int i, pos = 1;

      // 循环发送完整的RTP包
      for (i = 0; i < pktNum; i++)
      {
            rtpPacket->payload = (naluType & 0x60) | 28;
            rtpPacket->payload = naluType & 0x1F;

            if (i == 0) //第一包数据
                rtpPacket->payload |= 0x80; // start
            else if (remainPktSize == 0 && i == pktNum - 1) //最后一包数据
                rtpPacket->payload |= 0x40; // end

            memcpy(rtpPacket->payload+2, frame+pos, RTP_MAX_PKT_SIZE);// 复制数据到 RTP 负载
            ret = rtpSendPacketOverUdp(serverRtpSockfd, ip, port, rtpPacket, RTP_MAX_PKT_SIZE+2);
            if(ret < 0)
                return -1;

            rtpPacket->rtpHeader.seq++;
            sendBytes += ret;
            pos += RTP_MAX_PKT_SIZE;    // 增加 RTP 序列号和已发送字节数
      }

      // 发送剩余的不完整 RTP 包(如果有)
      if (remainPktSize > 0)
      {
            rtpPacket->payload = (naluType & 0x60) | 28;
            rtpPacket->payload = naluType & 0x1F;
            rtpPacket->payload |= 0x40; //end    设置 FU 指示器和 FU 头,标记为结束(E)

            memcpy(rtpPacket->payload+2, frame+pos, remainPktSize+2);   // 复制剩余的数据到 RTP 负载
            ret = rtpSendPacketOverUdp(serverRtpSockfd, ip, port, rtpPacket, remainPktSize+2);// 调用 rtpSendPacketOverUdp 发送 RTP 包
            if(ret < 0)
                return -1;

            rtpPacket->rtpHeader.seq++;
            sendBytes += ret;   // 增加 RTP 序列号和已发送字节数
      }
    }
    rtpPacket->rtpHeader.timestamp += 90000 / 25;   // 增加 RTP 时间戳,假设帧率为 25 fps
    out:

    return sendBytes;

}


static int handleCmd_OPTIONS(char* result, int cseq)
{
    sprintf(result, "RTSP/1.0 200 OK\r\n"
      "CSeq: %d\r\n"
      "Public: OPTIONS, DESCRIBE, SETUP, PLAY\r\n"
      "\r\n",
      cseq);

    return 0;
}

static int handleCmd_DESCRIBE(char* result, int cseq, char* url)
{
    char sdp;
    char localIp;

    sscanf(url, "rtsp://%[^:]:", localIp);

    sprintf(sdp, "v=0\r\n"
      "o=- 9%ld 1 IN IP4 %s\r\n"
      "t=0 0\r\n"
      "a=control:*\r\n"
      "m=video 0 RTP/AVP 96\r\n"
      "a=rtpmap:96 H264/90000\r\n"
      "a=control:track0\r\n",
      time(NULL), localIp);

    sprintf(result, "RTSP/1.0 200 OK\r\nCSeq: %d\r\n"
      "Content-Base: %s\r\n"
      "Content-type: application/sdp\r\n"
      "Content-length: %zu\r\n\r\n"
      "%s",
      cseq,
      url,
      strlen(sdp),
      sdp);

    return 0;
}

static int handleCmd_SETUP(char* result, int cseq, int clientRtpPort)
{
    sprintf(result, "RTSP/1.0 200 OK\r\n"
      "CSeq: %d\r\n"
      "Transport: RTP/AVP;unicast;client_port=%d-%d;server_port=%d-%d\r\n"
      "Session: 66334873\r\n"
      "\r\n",
      cseq,
      clientRtpPort,
      clientRtpPort + 1,
      SERVER_RTP_PORT,
      SERVER_RTCP_PORT);

    return 0;
}

static int handleCmd_PLAY(char* result, int cseq)
{
    sprintf(result, "RTSP/1.0 200 OK\r\n"
      "CSeq: %d\r\n"
      "Range: npt=0.000-\r\n"
      "Session: 66334873; timeout=10\r\n\r\n",
      cseq);

    return 0;
}

static void doClient(int clientSockfd, const char* clientIP, int clientPort) {

    char method;
    char url;
    char version;
    int CSeq;

    int serverRtpSockfd = -1, serverRtcpSockfd = -1;
    int clientRtpPort, clientRtcpPort;
    char* rBuf = (char*)malloc(BUF_MAX_SIZE);
    char* sBuf = (char*)malloc(BUF_MAX_SIZE);

    while (true) {
      int recvLen;

      recvLen = recv(clientSockfd, rBuf, BUF_MAX_SIZE, 0);
      if (recvLen <= 0) {
            break;
      }

      rBuf = '\0';
      printf("%s rBuf = %s \n",__FUNCTION__,rBuf);

      const char* sep = "\n";
      char* line = strtok(rBuf, sep);
      while (line) {
            if (strstr(line, "OPTIONS") ||
                strstr(line, "DESCRIBE") ||
                strstr(line, "SETUP") ||
                strstr(line, "PLAY")) {

                if (sscanf(line, "%s %s %s\r\n", method, url, version) != 3) {
                  // error
                }
            }
            else if (strstr(line, "CSeq")) {
                if (sscanf(line, "CSeq: %d\r\n", &CSeq) != 1) {
                  // error
                }
            }
            else if (!strncmp(line, "Transport:", strlen("Transport:"))) {
                // Transport: RTP/AVP/UDP;unicast;client_port=13358-13359
                // Transport: RTP/AVP;unicast;client_port=13358-13359

                if (sscanf(line, "Transport: RTP/AVP/UDP;unicast;client_port=%d-%d\r\n",
                  &clientRtpPort, &clientRtcpPort) != 2) {
                  // error
                  printf("parse Transport error \n");
                }
            }
            line = strtok(NULL, sep);
      }

      if (!strcmp(method, "OPTIONS")) {
            if (handleCmd_OPTIONS(sBuf, CSeq))
            {
                printf("failed to handle options\n");
                break;
            }
      }
      else if (!strcmp(method, "DESCRIBE")) {
            if (handleCmd_DESCRIBE(sBuf, CSeq, url))
            {
                printf("failed to handle describe\n");
                break;
            }
      }
      else if (!strcmp(method, "SETUP")) {
            if (handleCmd_SETUP(sBuf, CSeq, clientRtpPort))
            {
                printf("failed to handle setup\n");
                break;
            }

            serverRtpSockfd = createUdpSocket();
            serverRtcpSockfd = createUdpSocket();

            if (serverRtpSockfd < 0 || serverRtcpSockfd < 0)
            {
                printf("failed to create udp socket\n");
                break;
            }

            if (bindSocketAddr(serverRtpSockfd, "0.0.0.0", SERVER_RTP_PORT) < 0 ||
                bindSocketAddr(serverRtcpSockfd, "0.0.0.0", SERVER_RTCP_PORT) < 0)
            {
                printf("failed to bind addr\n");
                break;
            }

      }
      else if (!strcmp(method, "PLAY")) {
            if (handleCmd_PLAY(sBuf, CSeq))
            {
                printf("failed to handle play\n");
                break;
            }
      }
      else {
            printf("未定义的method = %s \n", method);
            break;
      }
      printf("sBuf = %s \n", sBuf);
      printf("%s sBuf = %s \n", __FUNCTION__, sBuf);

      send(clientSockfd, sBuf, strlen(sBuf), 0);


      //开始播放,发送RTP包
      if (!strcmp(method, "PLAY")) {

            int frameSize, startCode;               // 用于处理视频帧和起始码
            char* frame = (char*)malloc(500000);    // 用于存储读取的视频帧数据
            struct RtpPacket* rtpPacket = (struct RtpPacket*)malloc(500000);    // 用于存储RTP包
            FILE* fp = fopen(H264_FILE_NAME, "rb");
            if (!fp) {
                printf("读取 %s 失败\n", H264_FILE_NAME);
                break;
            }
            rtpHeaderInit(rtpPacket, 0, 0, 0, RTP_VESION, RTP_PAYLOAD_TYPE_H264, 0,
                0, 0, 0x88923423);                  // 初始化 RTP 包头,设置相关参数如版本、负载类型等。

            printf("start play\n");
            printf("client ip:%s\n", clientIP);
            printf("client port:%d\n", clientRtpPort);

            while (true) {
                frameSize = getFrameFromH264File(fp, frame, 500000);
                if (frameSize < 0)
                {
                  printf("读取%s结束,frameSize=%d \n", H264_FILE_NAME, frameSize);
                  break;
                }

                if (startCode3(frame))
                  startCode = 3;
                else
                  startCode = 4;

                frameSize -= startCode;
                rtpSendH264Frame(serverRtpSockfd, clientIP, clientRtpPort,
                  rtpPacket, frame + startCode, frameSize);   // 将视频帧数据封装成 RTP 包并发送给客户端

               

                Sleep(40);// 用于控制发送间隔,模拟帧率(此处为每秒 25 帧)
                //usleep(40000);//1000/25 * 1000
            }
            free(frame);
            free(rtpPacket);

            break;
      }

      memset(method,0,sizeof(method)/sizeof(char));
      memset(url,0,sizeof(url)/sizeof(char));
      CSeq = 0;

    }

    closesocket(clientSockfd);
    if (serverRtpSockfd) {
      closesocket(serverRtpSockfd);
    }
    if (serverRtcpSockfd > 0) {
      closesocket(serverRtcpSockfd);
    }

    free(rBuf);
    free(sBuf);

}


int main(int argc, char* argv[])
{
    // 启动windows socket start
    WSADATA wsaData;
    if (WSAStartup(MAKEWORD(2, 2), &wsaData) != 0)
    {
      printf("PC Server Socket Start Up Error \n");
      return -1;
    }
    // 启动windows socket end

    int rtspServerSockfd;


    rtspServerSockfd = createTcpSocket();
    if (rtspServerSockfd < 0)
    {
      WSACleanup();
      printf("failed to create tcp socket\n");
      return -1;
    }

    if (bindSocketAddr(rtspServerSockfd, "0.0.0.0", SERVER_PORT) < 0)
    {
      printf("failed to bind addr\n");
      return -1;
    }

    if (listen(rtspServerSockfd, 10) < 0)
    {
      printf("failed to listen\n");
      return -1;
    }

    printf("%s rtsp://127.0.0.1:%d\n", __FILE__, SERVER_PORT);

    while (true) {
      int clientSockfd;
      char clientIp;
      int clientPort;

      clientSockfd = acceptClient(rtspServerSockfd, clientIp, &clientPort);
      if (clientSockfd < 0)
      {
            printf("failed to accept client\n");
            return -1;
      }

      printf("accept client;client ip:%s,client port:%d\n", clientIp, clientPort);

      doClient(clientSockfd, clientIp, clientPort);
    }
    closesocket(rtspServerSockfd);

    return 0;
}
rtp.h

#pragma once#pragma comment(lib, "ws2_32.lib")#include <stdint.h>#define RTP_VESION            2#define RTP_PAYLOAD_TYPE_H264   96#define RTP_PAYLOAD_TYPE_AAC    97#define RTP_HEADER_SIZE         12#define RTP_MAX_PKT_SIZE      1400 /**    0                   1                   2                   3*    7 6 5 4 3 2 1 0|7 6 5 4 3 2 1 0|7 6 5 4 3 2 1 0|7 6 5 4 3 2 1 0*   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+*   |V=2|P|X|CC   |M|   PT      |       sequence number         |*   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+*   |                           timestamp                           |*   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+*   |         synchronization source (SSRC) identifier            |*   +=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+*   |            contributing source (CSRC) identifiers             |*   :                           ....                              :*   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+**/struct RtpHeader
{
    /* byte 0 */
    uint8_t csrcLen : 4;//CSRC计数器,占4位,指示CSRC 标识符的个数。
    uint8_t extension : 1;//占1位,如果X=1,则在RTP报头后跟有一个扩展报头。
    uint8_t padding : 1;//填充标志,占1位,如果P=1,则在该报文的尾部填充一个或多个额外的八位组,它们不是有效载荷的一部分。
    uint8_t version : 2;//RTP协议的版本号,占2位,当前协议版本号为2。

    /* byte 1 */
    uint8_t payloadType : 7;//有效载荷类型,占7位,用于说明RTP报文中有效载荷的类型,如GSM音频、JPEM图像等。
    uint8_t marker : 1;//标记,占1位,不同的有效载荷有不同的含义,对于视频,标记一帧的结束;对于音频,标记会话的开始。

    /* bytes 2,3 */
    uint16_t seq;//占16位,用于标识发送者所发送的RTP报文的序列号,每发送一个报文,序列号增1。接收者通过序列号来检测报文丢失情况,重新排序报文,恢复数据。

    /* bytes 4-7 */
    uint32_t timestamp;//占32位,时戳反映了该RTP报文的第一个八位组的采样时刻。接收者使用时戳来计算延迟和延迟抖动,并进行同步控制。

    /* bytes 8-11 */
    uint32_t ssrc;//占32位,用于标识同步信源。该标识符是随机选择的,参加同一视频会议的两个同步信源不能有相同的SSRC。

   /*标准的RTP Header 还可能存在 0-15个特约信源(CSRC)标识符
   
   每个CSRC标识符占32位,可以有0~15个。每个CSRC标识了包含在该RTP报文有效载荷中的所有特约信源

   */
};

struct RtpPacket{    struct RtpHeader rtpHeader;    uint8_t payload;};void rtpHeaderInit(struct RtpPacket* rtpPacket, uint8_t csrcLen, uint8_t extension,    uint8_t padding, uint8_t version, uint8_t payloadType, uint8_t marker,    uint16_t seq, uint32_t timestamp, uint32_t ssrc);int rtpSendPacketOverTcp(int clientSockfd, struct RtpPacket* rtpPacket, uint32_t dataSize);int rtpSendPacketOverUdp(int serverRtpSockfd, const char* ip, int16_t port, struct RtpPacket* rtpPacket, uint32_t dataSize); rtp.cpp

#include <sys/types.h>
#include <WinSock2.h>
#include <WS2tcpip.h>
#include <windows.h>
#include "rtp.h"

void rtpHeaderInit(struct RtpPacket* rtpPacket, uint8_t csrcLen, uint8_t extension,
    uint8_t padding, uint8_t version, uint8_t payloadType, uint8_t marker,
    uint16_t seq, uint32_t timestamp, uint32_t ssrc)
{
    rtpPacket->rtpHeader.csrcLen = csrcLen;
    rtpPacket->rtpHeader.extension = extension;
    rtpPacket->rtpHeader.padding = padding;
    rtpPacket->rtpHeader.version = version;
    rtpPacket->rtpHeader.payloadType = payloadType;
    rtpPacket->rtpHeader.marker = marker;
    rtpPacket->rtpHeader.seq = seq;
    rtpPacket->rtpHeader.timestamp = timestamp;
    rtpPacket->rtpHeader.ssrc = ssrc;
}
int rtpSendPacketOverTcp(int clientSockfd, struct RtpPacket* rtpPacket, uint32_t dataSize)
{

    rtpPacket->rtpHeader.seq = htons(rtpPacket->rtpHeader.seq);
    rtpPacket->rtpHeader.timestamp = htonl(rtpPacket->rtpHeader.timestamp);
    rtpPacket->rtpHeader.ssrc = htonl(rtpPacket->rtpHeader.ssrc);

    uint32_t rtpSize = RTP_HEADER_SIZE + dataSize;
    char* tempBuf = (char *)malloc(4 + rtpSize);
    tempBuf = 0x24;//$
    tempBuf = 0x00;
    tempBuf = (uint8_t)(((rtpSize) & 0xFF00) >> 8);
    tempBuf = (uint8_t)((rtpSize) & 0xFF);
    memcpy(tempBuf + 4, (char*)rtpPacket, rtpSize);

    int ret = send(clientSockfd, tempBuf, 4 + rtpSize, 0);

    rtpPacket->rtpHeader.seq = ntohs(rtpPacket->rtpHeader.seq);
    rtpPacket->rtpHeader.timestamp = ntohl(rtpPacket->rtpHeader.timestamp);
    rtpPacket->rtpHeader.ssrc = ntohl(rtpPacket->rtpHeader.ssrc);

    free(tempBuf);
    tempBuf = NULL;

    return ret;
}
int rtpSendPacketOverUdp(int serverRtpSockfd, const char* ip, int16_t port, struct RtpPacket* rtpPacket, uint32_t dataSize)
{
   
    struct sockaddr_in addr;
    int ret;

    addr.sin_family = AF_INET;
    addr.sin_port = htons(port);
    addr.sin_addr.s_addr = inet_addr(ip);

    rtpPacket->rtpHeader.seq = htons(rtpPacket->rtpHeader.seq);//从主机字节顺序转变成网络字节顺序(大端字节序)
    rtpPacket->rtpHeader.timestamp = htonl(rtpPacket->rtpHeader.timestamp);
    rtpPacket->rtpHeader.ssrc = htonl(rtpPacket->rtpHeader.ssrc);

    ret = sendto(serverRtpSockfd, (char *)rtpPacket, dataSize + RTP_HEADER_SIZE, 0,
      (struct sockaddr*)&addr, sizeof(addr));

    rtpPacket->rtpHeader.seq = ntohs(rtpPacket->rtpHeader.seq);
    rtpPacket->rtpHeader.timestamp = ntohl(rtpPacket->rtpHeader.timestamp);
    rtpPacket->rtpHeader.ssrc = ntohl(rtpPacket->rtpHeader.ssrc);

    return ret;

}

四、参考

RTP明白
H264简介
H264基础知识入门

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: RTP封装&h264原理&实现传输h264的RTSP服务器