呆板学习--卷积神经网络原理及MATLAB回归实现

打印 上一主题 下一主题

主题 968|帖子 968|积分 2904

卷积神经网络(Convolutional Neural Networks,缩写为CNNs或ConvNets)是一类专门为处理惩罚具有网格布局数据(如图像、音频)而设计的深度学习模型,在图像辨认、目标检测、语义分割等诸多范畴取得了巨大成功。
理论简介


1. 卷积层(Convolutional Layer)




  • 原理:卷积层是CNN的核心组成部门,通过卷积核在数据上滑动举行卷积操作,提取数据的局部特征。卷积核中的每个元素都与输入数据的对应位置举行乘法运算,然后将结果相加,得到卷积后的一个输出值。
  • 公式:假设输入特征图为X,大小为W*H*C(宽度、高度、通道数),卷积核为K,大小为
    (卷积核宽度、高度、输入通道数、输出通道数),则卷积层的输出特征图Y的盘算公式为

2. 池化层(Pooling Layer)



  • 原理:池化层通常用于减少数据的空间维度,同时生存主要特征。它通过在每个不重叠的局部地区内举行某种聚合操作(如取最大值、平均值等)来实现下采样。
  • 公式
 


S为步长,Kw,Kh为池化核的宽、高
3. 激活函数层(Activation Layer)



  • 原理:为神经网络引入非线性特性,使模型能够学习到更复杂的函数关系。常见的激活函数有ReLU、Sigmoid、Tanh等。
  • 公式

    • ReLU

    • Sigmoid

    • Tanh


 
4. 全毗连层(Fully Connected Layer)



  • 原理:全毗连层将经过卷积层和池化层提取到的特征举行整合,将其映射到最终的输出空间,用于分类、回归等任务。
5. 反向流传算法(Backpropagation)



  • 原理:用于训练CNN,通过盘算损失函数关于网络参数的梯度,然后根据梯度降落法更新参数,使得损失函数逐渐减小。

 MATLAB实现代码
  1. %%  清空环境变量
  2. clc                     % 清空命令行
  3. clear                   % 清空变量
  4. warning off             % 关闭报警信息
  5. close all               % 关闭开启的图窗
  6. %%  导入数据
  7. % res = xlsread('数据集.xlsx');
  8. res = xlsread('Long-Term Deflection of Reinforced Concrete Beams_New.xlsx');
  9. [Num, Dim] = size(res);  % 获取数据样本点个数Num和变量维度Dim
  10. %%  划分训练集和测试集
  11. rng(2048)
  12. temp = randperm(Num);
  13. P_train = res(temp(1: round(Num*0.8)), 1: Dim-1)';  % 80%用于训练
  14. T_train = res(temp(1: round(Num*0.8)), Dim)';       % 80%用于训练
  15. M = size(P_train, 2);  % 训练集样本点个数
  16. P_test = res(temp(round(Num*0.8)+1: end), 1: Dim-1)';  % 20%用于测试
  17. T_test = res(temp(round(Num*0.8)+1: end), Dim)';       % 20%用于测试
  18. N = size(P_test, 2);  % 测试集样本点个数
  19. %%  数据归一化
  20. [p_train, ps_input] = mapminmax(P_train, 0, 1);
  21. p_test = mapminmax('apply', P_test, ps_input);
  22. [t_train, ps_output] = mapminmax(T_train, 0, 1);
  23. t_test = mapminmax('apply', T_test, ps_output);
  24. %%  数据平铺
  25. %   将数据平铺成1维数据只是一种处理方式
  26. %   也可以平铺成2维数据,以及3维数据,需要修改对应模型结构
  27. %   但是应该始终和输入层数据结构保持一致
  28. D1 = Dim-1;
  29. D2 = 1;
  30. D3 = 1;
  31. p_train =  double(reshape(p_train, D1, D2, D3, M));
  32. p_test  =  double(reshape(p_test , D1, D2, D3, N));
  33. t_train =  double(t_train)';
  34. t_test  =  double(t_test )';
  35. %%  构造网络结构
  36. layers = [
  37.  imageInputLayer([D1, D2, D3])                         % 输入层 输入数据规模[D1, D2, D3]
  38.  convolution2dLayer([3, 1], 16, 'Padding', 'same')  % 卷积核大小 3*1 生成16张特征图
  39.  batchNormalizationLayer                            % 批归一化层
  40.  reluLayer                                          % Relu激活层
  41.  maxPooling2dLayer([2, 1], 'Stride', [1, 1])        % 最大池化层 池化窗口 [2, 1] 步长 [1, 1]
  42.  convolution2dLayer([3, 1], 32, 'Padding', 'same')  % 卷积核大小 3*1 生成32张特征图
  43.  batchNormalizationLayer                            % 批归一化层
  44.  reluLayer                                          % Relu激活层
  45.  dropoutLayer(0.1)                                  % Dropout层
  46.  fullyConnectedLayer(1)                             % 全连接层
  47.  regressionLayer];                                  % 回归层
  48. %%  参数设置
  49. options = trainingOptions('sgdm', ...      % SGDM 梯度下降算法
  50.     'MiniBatchSize', 32, ...               % 批大小,每次训练样本个数 32
  51.     'MaxEpochs', 1200, ...                 % 最大训练次数 1200
  52.     'InitialLearnRate', 1e-2, ...          % 初始学习率为0.01
  53.     'LearnRateSchedule', 'piecewise', ...  % 学习率下降
  54.     'LearnRateDropFactor', 0.1, ...        % 学习率下降因子
  55.     'LearnRateDropPeriod', 800, ...        % 经过 800 次训练后 学习率为 0.01 * 0.1
  56.     'Shuffle', 'every-epoch', ...          % 每次训练打乱数据集
  57.     'Plots', 'training-progress', ...      % 画出曲线
  58.     'Verbose', false);
  59. %%  训练模型
  60. net = trainNetwork(p_train, t_train, layers, options);
  61. %%  模型预测
  62. t_sim1 = predict(net, p_train);
  63. t_sim2 = predict(net, p_test );
  64. %%  数据反归一化
  65. T_sim1 = mapminmax('reverse', t_sim1, ps_output);
  66. T_sim2 = mapminmax('reverse', t_sim2, ps_output);
  67. %%  均方根误差
  68. error1 = sqrt(sum((T_sim1' - T_train).^2) ./ M);
  69. error2 = sqrt(sum((T_sim2' - T_test ).^2) ./ N);
  70. %%  绘制网络分析图
  71. analyzeNetwork(layers)
  72. %%  绘图
  73. figure
  74. plot(1: M, T_train, 'r-*', 1: M, T_sim1, 'b-o', 'LineWidth', 1)
  75. legend('真实值', '预测值')
  76. xlabel('预测样本')
  77. ylabel('预测结果')
  78. string = {'训练集预测结果对比'; ['RMSE=' num2str(error1)]};
  79. title(string)
  80. xlim([1, M])
  81. grid
  82. figure
  83. plot(1: N, T_test, 'r-*', 1: N, T_sim2, 'b-o', 'LineWidth', 1)
  84. legend('真实值', '预测值')
  85. xlabel('预测样本')
  86. ylabel('预测结果')
  87. string = {'测试集预测结果对比'; ['RMSE=' num2str(error2)]};
  88. title(string)
  89. xlim([1, N])
  90. grid
  91. %%  相关指标计算
  92. % R2
  93. R1 = 1 - norm(T_train - T_sim1')^2 / norm(T_train - mean(T_train))^2;
  94. R2 = 1 - norm(T_test  - T_sim2')^2 / norm(T_test  - mean(T_test ))^2;
  95. disp(['训练集数据的R2为:', num2str(R1)])
  96. disp(['测试集数据的R2为:', num2str(R2)])
  97. % MAE
  98. mae1 = sum(abs(T_sim1' - T_train)) ./ M ;
  99. mae2 = sum(abs(T_sim2' - T_test )) ./ N ;
  100. disp(['训练集数据的MAE为:', num2str(mae1)])
  101. disp(['测试集数据的MAE为:', num2str(mae2)])
  102. % MBE
  103. mbe1 = sum(T_sim1' - T_train) ./ M ;
  104. mbe2 = sum(T_sim2' - T_test ) ./ N ;
  105. disp(['训练集数据的MBE为:', num2str(mbe1)])
  106. disp(['测试集数据的MBE为:', num2str(mbe2)])
  107. %%  绘制散点图
  108. sz = 25;
  109. c = 'b';
  110. figure
  111. scatter(T_train, T_sim1, sz, c)
  112. hold on
  113. plot(xlim, ylim, '--k')
  114. xlabel('训练集真实值');
  115. ylabel('训练集预测值');
  116. xlim([min(T_train) max(T_train)])
  117. ylim([min(T_sim1) max(T_sim1)])
  118. title('训练集预测值 vs. 训练集真实值')
  119. figure
  120. scatter(T_test, T_sim2, sz, c)
  121. hold on
  122. plot(xlim, ylim, '--k')
  123. xlabel('测试集真实值');
  124. ylabel('测试集预测值');
  125. xlim([min(T_test) max(T_test)])
  126. ylim([min(T_sim2) max(T_sim2)])
  127. title('测试集预测值 vs. 测试集真实值')
复制代码

 
 

 

 

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

曂沅仴駦

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表