halcon 深度学习教程(一)分类检测 (工业里如何利用halcon深度学习去 ...

瑞星  金牌会员 | 2025-3-12 12:42:34 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 954|帖子 954|积分 2862

原文作者:aircraft
原文链接:https://www.cnblogs.com/DOMLX/p/18766108
   
 
 
深度学习教程目录如下,还在继承更新美满中
深度学习系列教程目录
 
 
  本篇主要是入门halcon的深度学习篇,参考halcon实例classify_fruit_deep_learning.hdev,不过去实例的话会比较复杂一些,未便于理解,这边我提取了一些主要的,只做二分类比如NG,OK分类即可。
如果你学习完本篇,那么工业上的一些检测都可以直接用这篇深度学习分类检测里的算子去实现了,因为很多多少工业的产品,半导体,LED,PCB检测等等末了都是检测产品的好与坏,也就是OK,NG的分类检测。(不过要留意的一点是,因为深度学习的神经网络模型需要很多练习的资源,以是应用场景上还是适合那些品类较少的产品检测,这样你就不用练习出几百个模式去对应了,不然想想就会觉得非常的麻烦)但是这些还不够,对接过甲方的都知道,你要把饭喂到他们的嘴里才肯吃,以是最好的利用还是,将分类的检测的数据练习单独开发一个软件,通过TCP与本身的软件对接,检测软件实时收集数据然后通讯告诉练习软件不断的去练习数据,在把练习的差不多的模型给检测软件利用。大概是这样的意思,具体实现就看本身的项目了。
 
一.深度学习预备知识
1.批量(Batch)
定义: 批量是指一次练习过程中,模型利用的一组输入数据。通常情况下,数据聚会会议被分成多个小批量来练习模型,因为一个大的模型想要练习好都需要非常多的数据量,数据量多的情况下,如果一次就把全部数据都传着迷经网络里,那么效率会非常的慢。
  批次大小BatchSize一般设置为1,2,4,8,16,32等2的倍数。
   较大的批次大小可以利用硬件的并行盘算本领,一次处理更多的样本,淘汰迭代次数,从而在一定程度上缩短练习时间。较大的批次大小可以使梯度估计更加稳固,因为它综合了更多样本的信息。根据大数定律,样本数目越多,梯度估计越接近真实的梯度方向,模型更新更稳固,更有可能朝着最优解的方向收敛。
  但同时较大的批次大小可能会使模型过于顺应练习数据,导致过拟合。相应的较小的批次大小可以让模型在练习过程中更频仍地接触到不同的样本组合,更好地捕捉数据的多样性,有助于进步模型的泛化本领。以是我们要根据练习集大小、模型结构、模型练习情况以及各种因素来综合考量批次大小的选取。


2.epoch
epoch = 1 表示将练习数据集中的全部样本都过一遍,就完成了练习,就等于上面你把数据分成了很多批,而这里关注的就是全部批的总和。一般我们都会重复练习很多次,反复利用数据,调整损失函数和学习率等等。
3.iterantion
迭代,epoch = 100,就相当于重复练习全部数据一百次
 
4.优化器(Optimizer)
定义: 优化器是用于更新模型参数以最小化损失函数的算法。常见的优化器有梯度下降、Adam等。在本文代码里就可以理解为我们调整更新学习率LearningRate的方法,本实例是迭代多少次后将学习率乘以0.1,不断的缩小学习率,希望在这个过程中可以得到模型练习的最优解。
 
5.学习率 (LearningRate)
学习率用于控制神经网络反向传播中参数更新的步长,控制损失函数梯度下降的速率,具体来说,梯度下降是一种常用的优化算法,它通过盘算损失函数关于模型参数的梯度,来确定参数更新的方向和幅度
 
本文就大概知道这么多,比较如果你看深度学习,肯定有或多或少的了解过了。还想知道更多参数的可以参考一下这篇博客:https://blog.csdn.net/bkirito/article/details/145774610
 
二.拆解实例代码
 
为了方便大家的学习和理解,我将本篇实例代码拆解成了七个部分去解析。但是在开始之前还是要知道一下分类检测的主要算子:
1.read_dl_classifier( : : FileName : DLClassifierHandle)
这个比较简朴不多说就是读取模型,生成个分类模型的句柄。
2.set_dl_classifier_param( : : DLClassifierHandleGenParamNameGenParamValue : )
函数作用

此函数用于动态设置或修改已加载的深度学习分类器(如DNN模型)的参数,涵盖练习配置、输入预处理、优化器选项等。通常在模型练习前或运行时调用以调整行为。
参数解析


  • DLClassifierHandle (输入)

    • 范例: HTuple(句柄)
    • 说明: 通过 read_dl_classifier 或 create_dl_classifier 创建的深度学习分类器句柄,唯一标识一个模型实例。

  • GenParamName (输入)

    • 范例: HTuple(字符串/数组)
    • 说明: 待设置的参数名。可为单个字符串或多个参数名组成的数组。

  • GenParamValue (输入)

    • 范例: HTuple(多范例)
    • 说明: 对应参数的值,范例需与参数名匹配(如整数、浮点数、字符串等)。

常见参数名及值

以下列举典型参数:
参数名 (GenParamName)值范例说明与示例'input_width' / 'input_height'整数输入图像的尺寸,如 256。'learning_rate'浮点数初始学习率,如 0.001。'batch_size'整数练习/推理的批次大小,如 16。'device'字符串盘算设备,如 'gpu'、'cpu'。'momentum'浮点数优化器动量参数,如 0.9(适用于SGD)。'weight_prior'浮点数权重衰减(L2正则化),如 0.0001。'enable_augmentation'布尔值是否启用数据增强,'true' 或 'false'。'max_iterations'整数最大练习迭代次数,如 1000。'pretrained_model'
字符串预练习模型路径,如 'resnet50.hdl'。
还有很多这里就不一一写出来可以直接查看这个算子,另外个get_dl_classifier_param就是反过来获取参数值的意思。
 
 
 

 
 
3.read_dl_classifier_data_set()
 
 
read_dl_classifier_data_set 是 Halcon 中用于自动读取分类数据集的专用算子。其核心功能是通过分析文件夹结构,将不同类别的图像数据与标签自动关联,为后续的深度学习模型练习提供标准化的输入格式。
 
参数详解 
1. 输入参数

 
参数名范例说明RawDataFolder字符串原始数据集根目录路径。要求子文件夹按类别存放图像(如 OK/、NG/)'last_folder'字符串标签提取方法:'last_folder' 表示用最底层文件夹名作为类别标签 
2. 输出参数

 
参数名范例说明RawImageFiles字符串数组全部图像文件的绝对路径(如 ['E:/data/OK/img1.jpg', ...])Labels字符串数组每个图像对应的类别名称(如 ['OK', 'OK', 'NG', ...])LabelIndices整数数组每个图像的类别索引(基于 Classes 的次序,如 [0, 0, 1, ...])Classes字符串数组全部唯一的类别名称(如 ['OK', 'NG']) 
在本文中代表意思就是:
 

  • RawDataFolder:原始数据文件夹路径。这里用户给出的路径是包罗'OK'和'NG'两个子文件夹的目录,可能每个子文件夹对应一个类别,存放对应类别的图像。
  • ​**'last_folder'**:这是一个字符串参数,可能用于指定如何从文件夹结构中提取标签。常见的方法是根据末了一层文件夹名作为类别标签。
  • RawImageFiles:输出参数,存储全部找到的图像文件路径。
  • Labels:输出参数,每个图像对应的标签,可能直接是文件夹名称,如'OK'或'NG'。
  • LabelIndices:标签的索引,通常是数值形式(如0和1),对应Classes中的次序。
  • Classes:全部唯一的类别名称,如['OK', 'NG']。
 
 
 
 
4.split_dl_classifier_data_set( : : ImageFilesGroundTruthLabelsTrainingPercentValidationPercent : TrainingImagesTrainingLabelsValidationImagesValidationLabelsTestImagesTestLabels)
 
 
split_dl_classifier_data_set 是 Halcon 中用于将深度学习分类数据集划分为 ​练习集验证集 和 ​测试集 的核心算子。它的核心目的是确保模型练习时有独立的数据用于调参和性能评估,避免过拟合。
 
参数详解 
输入参数

 
参数名范例说明ImageFiles字符串数组全部图像文件的路径列表(通过 read_dl_classifier_data_set 生成)Labels字符串数组每个图像对应的类别标签TrainingPercent整数/浮点数​练习集占比​(如 70 表示 70% 数据用于练习)ValidationPercent整数/浮点数​验证集占比​(如 15 表示 15% 数据用于验证) 
输出参数

 
参数名范例说明TrainingImages字符串数组练习集图像路径列表TrainingLabels字符串数组练习集标签列表ValidationImages字符串数组验证集图像路径列表ValidationLabels字符串数组验证集标签列表TestImages字符串数组测试集图像路径列表TestLabels字符串数组测试集标签列表 
关键特性 

  • 比例分配规则

    • 练习集、验证集、测试集的占比总和 ​必须 ≤ 100%
    • 若总和 < 100%,剩余数据会被丢弃(实际开发中需避免这种情况)。
    示例

    • TrainingPercent=70, ValidationPercent=15 → 测试集自动占 15%。

  • 随机分层抽样

    • 保持类别均衡:每个子集的类别比例与原数据集一致。
    • 随机性控制:通过 set_system ('seed_rand', 42) 固定随机种子可复现划分结果。

  • 异常处理

    • 如果某个类别的样本过少(如只有 1 张图像),可能导致验证集或测试集中缺少该类,此时会触发告诫。

 
 
 
 
5.select_percentage_dl_classifier_data( : : ImageFilesGroundTruthLabelsSelectPercentage : ImageFilesOutLabelsOut)
 
 
select_percentage_dl_classifier_data 是 Halcon 中用于从分类数据集中按比例抽取子集的算子,其核心功能是 ​分层抽样​(Stratified Sampling),即在保持类别分布的前提下,按指定比例从原数据集中选择样本。常用于快速验证模型或小样本实验场景。
 
参数详解 
输入参数

 
参数名范例说明ImageFiles字符串数组原数据集的图像路径列表(完整数据集)Labels字符串数组原数据集的标签列表SelectPercentage整数/浮点数抽取比例(范围:0.0~100.0,如 30 表示抽取30%的数据) 
输出参数

 
参数名范例说明SelectedImages字符串数组抽取后的图像路径列表SelectedLabels字符串数组抽取后的标签列表 
关键特性 

  • 分层抽样(Stratified Sampling)​

    • 保持类别分布:每个类别按比例独立抽取。
      示例
      原数据有 OK(60%)和 NG(40%),若 SelectPercentage=50,则新数据中 OK 仍占60%,NG占40%。

  • 随机性控制

    • 通过 set_system ('seed_rand', 42) 固定随机种子,确保可重复性。

  • 边界处理

    • 若某个类别样本过少(如仅有1个样本),则至少保留1个样本。

 
典型应用场景 

    • 快速原型验证
      在大数据集上练习耗时过长时,抽取10%~30%数据快速验证模型结构。
    • 类别均衡实验
      通过调整不同类别的抽取比例,研究类别不均衡对模型的影响。
    • 数据增强评估
      对比完整数据集与子集在增强策略下的性能差异。

 
 
6.train_dl_classifier_batch(BatchImages : : DLClassifierHandleBatchLabels : DLClassifierTrainResultHandle)
 
 
train_dl_classifier_batch 是 Halcon 中用于执行 ​单批次练习 的核心算子,通过输入一个批次的图像数据和对应标签,更新深度学习分类器的模型参数。它是迭代式练习流程的关键步骤,通常嵌入在 epoch 循环中。
 
参数详解 
输入参数

 
参数名范例说明BatchImages图像对象数组当前批次的图像数据(需已预处理为模型输入格式)DLClassifierHandle句柄已初始化的深度学习分类器模型句柄BatchLabels字符串/整数数组当前批次的标签(需与 Classes 次序一致) 
输出参数

 
参数名范例说明DLClassifierTrainResultHandle句柄练习结果句柄,用于提取损失、准确率等指标 
执行流程 

  • 前向传播:盘算模型对当前批次的猜测输出。
  • 损失盘算:根据损失函数(如交叉熵)盘算猜测值与真实标签的偏差。
  • 反向传播:盘算损失对模型参数的梯度。
  • 参数更新:利用优化器(如Adam)根据梯度更新模型权重。
 
 
 
7.apply_dl_classifier_batchwise( : : ImageFilesDLClassifierHandle : DLClassifierResultIDsPredictedClassesConfidences)
 
apply_dl_classifier_batchwise 是 Halcon 中用于 ​批量推理 的算子,可高效地对一批图像举行分类猜测。其核心功能是利用练习好的深度学习模型,对输入的一组图像举行批量推理,返回猜测结果及置信度。适用于需要快速处理大量数据的场景(如产线实时检测)。
 
参数详解 
输入参数

 
参数名范例说明BatchImages图像对象数组待推理的图像批次(需与练习时预处理一致)DLClassifierHandle句柄已加载的深度学习分类器模型句柄 
输出参数

 
参数名范例说明DLClassifierResultIDs句柄数组推理结果句柄,用于提取详细猜测数据PredictedLabels字符串数组每个图像的猜测类别(如 ['OK', 'NG', 'OK', ...])Confidences浮点数数组猜测置信度(范围:0.0~1.0,如 [0.98, 0.75, ...]) 
执行流程 

  • 输入校验

    • 检查图像尺寸、通道数是否与模型输入要求一致。
    • 验证批次大小是否超过显存容量。

  • 批量推理

    • 将图像数据批量传输至GPU。
    • 执行模型前向盘算,生成猜测结果。

  • 结果解析

    • 提取每个图像的猜测类别(PredictedLabels)及置信度(Confidences)。
    • 对于多标签分类,返回每个类别的置信度(需通过句柄进一步解析)。

 
 
 
8.evaluate_dl_classifier( : : GroundTruthLabelsDLClassifierHandleDLClassifierResultIDEvaluationMeasureTypeClassesToEvaluate : EvaluationMeasure)
 
evaluate_dl_classifier 是 Halcon 中用于 ​定量评估分类模型性能 的核心算子。其核心功能是盘算模型在指定数据集上的性能指标(如准确率、召回率、混淆矩阵等),为模型优化和部署提供数据支持。
 
参数详解 
输入参数

 
参数名范例说明GroundTruthLabels字符串数组数据集的真实标签列表(需与猜测标签次序一致)DLClassifierHandle句柄已加载的深度学习分类器模型句柄DLClassifierResultIDs句柄数组通过 apply_dl_classifier_batchwise 生成的推理结果句柄Metric字符串评估指标范例(如 'top1_error', 'precision', 'confusion_matrix')AggregationMode字符串结果聚合方式('global' 全局统计,'class' 按类别统计) 
输出参数

 
参数名范例说明Value浮点数/矩阵评估结果(如错误率、精确率,或混淆矩阵) 
支持的评估指标(Metric 参数)​ 
指标名称说明输出范例'top1_error'整体错误率(1 - 准确率)浮点数'precision'精确率(需配合 'class' 聚合模式)浮点数数组'recall'召回率(需配合 'class' 聚合模式)浮点数数组'f1_score'F1分数(精确率和召回率的调和均匀)浮点数数组'confusion_matrix'混淆矩阵(真实类别 vs 猜测类别)矩阵(整数) 
 
 
9.plot_dl_classifier_training_progress( : : TrainingErrorsValidationErrorsLearningRatesEpochsNumEpochsWindowHandle : )
 
plot_dl_classifier_training_progress 是 Halcon 中用于 ​可视化练习过程指标 的专用算子,其核心功能是将练习偏差、验证偏差、学习率等关键指标以曲线图形式实时展示,帮助开发者直观监控模型收敛情况,实时调整超参数。
 
参数详解 
输入参数

 
参数名范例说明TrainingErrors浮点数数组练习集偏差值序列(如 [0.85, 0.62, 0.41, ...])ValidationErrors浮点数数组验证集偏差值序列(长度需与 TrainingErrors 一致)LearningRates浮点数数组学习率变革序列(可选,用于观察学习策略效果)Epochs浮点数数组横轴坐标值(通常为 [0, 1, 2, ...] 或归一化后的比例)NumEpochs整数总练习轮次(用于设置横轴范围)WindowHandle句柄图形窗口句柄(需通过 dev_open_window 提前创建) 
可视化效果说明 

  • 默认表现

    • 蓝色曲线:练习集偏差(TrainingErrors)
    • 红色曲线:验证集偏差(ValidationErrors)
    • 绿色曲线:学习率(LearningRates,若提供)

  • 坐标轴

    • X轴:练习轮次(Epochs)或迭代次数。
    • Y轴(左)​:偏差值(0.0~1.0)。
    • Y轴(右)​:学习率(对数标准,若 LearningRates 变革较大)。

 
 
 
 
好了一些主要的算子都讲完了,这里我利用的图片
 

 着实就是把halcon实例中带有橙子和梨的数据改为了分类为OK,NG的数据,如果是橙子,那么就是OK标签,如果是梨那么就是NG标签。
 
 

 

 因为这里不能用我本身电脑上客户的半导体/led的晶圆片的数据来展示,不然到时间就要被告泄密工艺了。如果你理解了这个实例的分类逻辑,那么你的产品检测不就是收集处理好NG,OK的产品,分别传入程序练习,得到一个你产品可以利用的模型,背面就直接利用这个模型来举行检测了。要留意的点就是预处理要做好,最好练习的数据就已经把你要检测的部分分割出来单独作为图片去练习,背面检测也是这样提取好传入。这样才气更好的用最少的数据,得到最优的结果。
 
 
第一部分:
 
  1. * 第一部分:窗体与环境初始化
  2. * 功能:关闭图形更新、创建新窗口、设置字体和随机种子
  3. * 作用:确保实验环境一致性和可视化界面准备
  4. dev_update_off ()  
  5. * 禁止HDevelop自动刷新图形界面
  6. dev_close_window ()  
  7. * 关闭所有已存在的图形窗口
  8. WindowWidth := 800  
  9. * 定义新窗口的宽度为800像素
  10. WindowHeight := 600  
  11. * 定义新窗口的高度为600像素
  12. * 创建自适应尺寸的图形窗口
  13. dev_open_window_fit_size (0, 0, WindowWidth, WindowHeight, -1, -1, WindowHandle)
  14. * 设置窗口字体为16号等宽字体
  15. set_display_font (WindowHandle, 16, 'mono', 'true', 'false')
  16. * 固定随机种子保证实验可重复性
  17. set_system ('seed_rand', 42)  
  18. * 设置随机数生成器种子为42
复制代码
 
第一部分就是一些窗体的初始化,就不多讲了,解释我都一一打好了。
 
 
 
第二部分:
  1. * 第二部分:模型与数据初始化
  2. * 功能:加载预训练模型、配置GPU、定义数据集路径
  3. * 作用:为后续训练准备基础模型和数据路径
  4. * 加载预训练的紧凑型分类器模型
  5. read_dl_classifier ('pretrained_dl_classifier_compact.hdl', DLClassifierHandle)
  6. * 强制使用GPU加速推理 如果你的电脑没有显卡,可以改为cpu速度会慢一些也可以用
  7. set_dl_classifier_param (DLClassifierHandle, 'runtime', 'gpu')
  8. *原始数据存放路径  这里以及后面可以填你们自己的路径 记住!!!
  9. RawDataFolder :='E:/公司/code/JM/模块/halcon相关/halcon深度学习相关/分类检测/分类检测/分类检测/Images/' + ['OK','NG']
  10. * 包含OK/NG分类的原始数据路径
  11. * 自动解析数据集并生成标签
  12. read_dl_classifier_data_set (RawDataFolder, 'last_folder', RawImageFiles, Labels, LabelIndices, Classes)
  13. * 定义预处理数据存储路径
  14. PreprocessedFolder := 'E:/公司/code/JM/模块/halcon相关/halcon深度学习相关/分类检测/分类检测/分类检测/分类检测hobj'
  15. * 预处理后的HOBJ文件存储目录
  16. * 设置预处理数据清理标志
  17. RemovePreprocessingAfterExample := true  
  18. * true表示运行后自动删除预处理数据
复制代码
 
  1. 这部分要注意一下'pretrained_dl_classifier_compact.hdl'参数,这里halcon的实例主要有三个常用的分类模型<br>pretrained_dl_classifier_compact.hdl模型<br> pretrained_dl_classifier_enhanced.hdl模型<br> retrained_dl_classifier_resnet50.hdl模型<br>测试玩耍就直接使用pretrained_dl_classifier_compact.hdl模型就行了,他的模型量级比较小,使用较少的数据就可以训练出来一个相对OK的结果。<br>如果是工业软件正式的使用还是建议retrained_dl_classifier_resnet50.hdl模型,数据量虽然占用比较大,但是准确率会好。<br>具体模型资源的路径应该是在实例的路径下,如下图。
复制代码

 
 
第三部分:
  1. * 第三部分:数据预处理
  2. * 功能:创建预处理目录、标准化图像尺寸、归一化像素值、通道数修正
  3. * 作用:将原始数据转换为模型可处理的标准化格式
  4. * 检查并重建预处理目录结构
  5. file_exists (PreprocessedFolder, FileExists)
  6. if (FileExists)
  7.     * 递归删除已有预处理目录
  8.     remove_dir_recursively (PreprocessedFolder)
  9. endif
  10. * 创建新的预处理目录结构
  11. make_dir (PreprocessedFolder)  
  12. * 创建根目录
  13. for I := 0 to |Classes| - 1 by 1
  14.     * 按类别创建子目录
  15.     make_dir (PreprocessedFolder + '/' + Classes[I])  
  16. endfor
  17. * 解析原始图像文件名信息
  18. parse_filename (RawImageFiles, BaseNames, Extensions, Directories)
  19. * 构建预处理文件输出路径模板
  20. ObjectFilesOut := PreprocessedFolder + '/' + Labels + '/' + BaseNames + '.hobj'
  21. * 定义模型输入规格参数
  22. DlImageWidth := 224   
  23. * 模型要求的输入图像宽度
  24. DlImageHeight := 224   
  25. * 模型要求的输入图像高度
  26. DlNumChannels := 3     
  27. * 模型要求的通道数
  28. DlRangeMin := -127.0   
  29. * 像素归一化下限值
  30. DlRangeMax := 128.0   
  31. * 像素归一化上限值
  32. * 开始遍历处理所有原始图像
  33. for i := 0 to |RawImageFiles|-1 by 1
  34.     * 读取原始图像文件
  35.     read_image (Image,RawImageFiles[i])
  36.    
  37.     * 执行图像尺寸标准化
  38.     zoom_image_size (Image, Image, DlImageWidth, DlImageHeight, 'constant')
  39.    
  40.     * 转换图像类型为实数型(用于归一化计算)
  41.     convert_image_type (Image, Image, 'real')
  42.    
  43.     * 计算像素值缩放比例
  44.     RescaleRange := (DlRangeMax-DlRangeMin)/255.0
  45.     * 执行像素值归一化到[-127,128]区间
  46.     scale_image (Image, Image, RescaleRange, DlRangeMin)
  47.    
  48.     * 检查并修复通道数问题
  49.     count_obj (Image, Number)
  50.     for j := 1 to Number by 1   
  51.         select_obj (Image, ObjectSelected, j)
  52.         count_channels (ObjectSelected, Channel)
  53.         if (Channel != DlNumChannels)
  54.             * 将单通道图像复制为三通道
  55.             compose3 (ObjectSelected, ObjectSelected, ObjectSelected, ThreeChannel)
  56.             * 替换原始图像对象
  57.             replace_obj (Image, ThreeChannel, Image, 1)
  58.         endif
  59.     endfor
  60.    
  61.     * 保存预处理后的图像到HOBJ文件
  62.     write_object (Image, ObjectFilesOut[i])
  63. endfor  
  64. * 显示预处理完成提示
  65. dev_clear_window ()
  66. dev_disp_text ('预处理完成。', 'window', 'top', 'left', 'black', [], [])
复制代码
 
 
第四部分:
  1. *
  2. *第四部分:将准备用来训练测试的数据集进行划分
  3. *数据集划分。读取预处理后的数据,按比例分为训练集、验证集和测试集。这是机器学习常规步骤,确保模型评估的准确性。
  4. *
  5. *
  6. *将数据分为 训练集,验证集,测试集
  7. *读取处理后的数据
  8. read_dl_classifier_data_set (PreprocessedFolder, 'last_folder', ImageFiles, Labels, LabelsIndices, Classes)
  9. *将数据分为三个子集,训练集占:70%、验证集占:15%、测试集占:15%
  10. TrainingPercent := 70
  11. ValidationPercent := 15
  12. *将数据拆分 参数:输入图像路径、输入的标签、训练%,验证%、返回用于训练的图像、返会用于训练图像的标签、返回用于验证的图像、返会用于验证图像的标签、返回用于测试的图像、返会用于测试图像的标签
  13. split_dl_classifier_data_set (ImageFiles, Labels, TrainingPercent, ValidationPercent, TrainingImages, TrainingLabels, ValidationImages, ValidationLabels, TestImages, TestLabels)
复制代码
 
第五部分:
[code]** 第五部分:模型练习* 功能:配置练习参数、执行练习循环、保存最佳模型* 作用:通过迭代优化模型参数提升分类性能* 设置模型分类类别* 模型练习。设置模型参数,如类别、批大小、学习率等。练习循环包括数据增强、分批练习、损失盘算、学习率调整,* 并保存最佳模型。这部分是核心,直接影响模型性能。***设置网络练习参数,为了对神经网络举行再练习,我们必须指定分类问题的类名*设置网络类名set_dl_classifier_param (DLClassifierHandle, 'classes', Classes)*设置网络练习批处理数BatchSize := 8set_dl_classifier_param (DLClassifierHandle, 'batch_size', BatchSize)*设置运行情况try    set_dl_classifier_param (DLClassifierHandle, 'runtime_init', 'immediately')catch (Exception)    *表现相应范例的错误    *dev_disp_error_text (Exception)    if (RemovePreprocessingAfterExample and Exception[0] != 4104)        remove_dir_recursively (PreprocessedFolder)        dev_disp_text ('文件夹中的预处理数据 "' + PreprocessedFolder + '" 已删除。', 'window', 'bottom', 'left', 'black', [], [])    endif    stop ()endtry*学习率InitialLearningRate := 0.001set_dl_classifier_param (DLClassifierHandle, 'learning_rate', InitialLearningRate)*每30次根据下降因子更新学习率LearningRateStepEveryNthEpoch := 30LearningRateStepRatio := 0.1*迭代次数NumEpochs := 100dev_clear_window ()dev_disp_text ('练习已经开始...', 'window', 'top', 'left', 'black', [], [])*每迭代4次绘制一下图PlotEveryNthEpoch := 4*生成的网络模型的存放路径path := 'E:/公司/code/JM/模块/halcon干系/halcon深度学习干系/分类检测/分类检测/分类检测/'*练习好的网络模型名称FileName := path + 'classifier_test.hdl'*练习模型* 初始化练习过程记载容器* TrainingErrors: 存储练习集错误率变革曲线数据* ValidationErrors: 存储验证集错误率变革曲线数据  * LearningRates: 存储学习率调整历史数据* Epochs: 存储绘图点对应的epoch数值* LossByIteration: 存储每个批次的损失值TrainingErrors := []ValidationErrors := []LearningRates := []Epochs := []LossByIteration := []* 获取当前模型的批处理大小参数get_dl_classifier_param (DLClassifierHandle, 'batch_size', BatchSize)* 初始化最小验证错误率为最大值(1代表100%错误)MinValidationError := 1* 盘算练习过程参数* NumBatchesInEpoch: 每个epoch包罗的批次数* NumTotalIterations: 总迭代次数(全部epoch的总批次数)* PlottedIterations: 需要绘制练习曲线的关键迭代点聚集NumBatchesInEpoch := int(floor(|TrainingImages| / real(BatchSize)))NumTotalIterations := (NumBatchesInEpoch * NumEpochs) - 1PlottedIterations := round([NumBatchesInEpoch * [0lotEveryNthEpoch:NumEpochs - 1],NumTotalIterations])* 生成练习数据索引序列(0到练习样本总数-1)tuple_gen_sequence (0, |TrainingImages| - 1, 1, TrainSequence)* 选择100%练习数据用于周期验证(全量数据评估)SelectPercentageTrainingImages := 100select_percentage_dl_classifier_data (TrainingImages, TrainingLabels, SelectPercentageTrainingImages, TrainingImagesSelected, TrainingLabelsSelected)* 开始epoch循环练习for Epoch := 0 to NumEpochs - 1 by 1    * 每个epoch开始时打乱练习数据次序    * 增强练习随机性,避免模型记忆数据次序    tuple_shuffle (TrainSequence, TrainSequence)        * 遍历当前epoch的全部批次    for Iteration := 0 to NumBatchesInEpoch - 1 by 1        * 盘算当前批次的索引范围        BatchStart := Iteration * BatchSize        BatchEnd := BatchStart + (BatchSize - 1)                * 获取当前批次的随机索引        BatchIndices := TrainSequence[BatchStart:BatchEnd]                * 根据索引获取对应的图像路径和标签        BatchImageFiles := TrainingImages[BatchIndices]        BatchLabels := TrainingLabels[BatchIndices]                * 加载当前批次的图像数据        read_image (BatchImages, BatchImageFiles)                * 执行数据增强(随机镜像翻转)        * GenParamName: 增强范例为镜像        * GenParamValue: 随机组合水平/垂直翻转(rc=random combination)        GenParamName := 'mirror'        GenParamValue := 'rc'        augment_images (BatchImages, BatchImages, GenParamName, GenParamValue)                * 执行单批次练习并获取练习结果句柄        train_dl_classifier_batch (BatchImages, DLClassifierHandle, BatchLabels, DLClassifierTrainResultHandle)               * 从练习结果中提取损失值        get_dl_classifier_train_result (DLClassifierTrainResultHandle, 'loss', Loss)                * 记载当前批次的损失值        LossByIteration := [LossByIteration,Loss]                * 盘算当前全局迭代次数(总批次数)        CurrentIteration := int(Iteration + (NumBatchesInEpoch * Epoch))                * 判断是否到达预设的绘图点        if (sum(CurrentIteration [==] PlottedIterations))            * 在练习子集上举行推理评估            apply_dl_classifier_batchwise (TrainingImagesSelected, DLClassifierHandle, TrainingDLClassifierResultIDs, TrainingPredictedLabels, TrainingConfidences)                        * 在验证集上举行推理评估            apply_dl_classifier_batchwise (ValidationImages, DLClassifierHandle, ValidationDLClassifierResultIDs, ValidationPredictedLabels, ValidationConfidences)                        * 盘算练习集的TOP1错误率            evaluate_dl_classifier (TrainingLabelsSelected, DLClassifierHandle, TrainingDLClassifierResultIDs, 'top1_error', 'global', TrainingTop1Error)                        * 盘算验证集的TOP1错误率            evaluate_dl_classifier (ValidationLabels, DLClassifierHandle, ValidationDLClassifierResultIDs, 'top1_error', 'global', ValidationTop1Error)                        * 获取当前学习率参数            get_dl_classifier_param (DLClassifierHandle, 'learning_rate', LearningRate)                        * 记载当前评估点数据            TrainingErrors := [TrainingErrors,TrainingTop1Error]            ValidationErrors := [ValidationErrors,ValidationTop1Error]            LearningRates := [LearningRates,LearningRate]            Epochs := [Epochs,PlottedIterations[|Epochs|] / real(NumBatchesInEpoch)]                        * 更新练习过程可视化图表            plot_dl_classifier_training_progress (TrainingErrors, ValidationErrors, LearningRates, Epochs, NumEpochs, WindowHandle)                        * 保存当前最佳模型(当验证错误率创新低时)            if (ValidationTop1Error

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

瑞星

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表