IT评测·应用市场-qidao123.com技术社区

标题: AI小白的第十天:影响模子泛化本领的因素以及对策 [打印本页]

作者: 惊落一身雪    时间: 2025-4-3 05:04
标题: AI小白的第十天:影响模子泛化本领的因素以及对策
之前写了两次识别手写数字的模子练习,模子对我自己手写图片的识别结果总是不尽人意。
厥后相识到,模子在练习中命中率高,但是实战命中率差,就可能是出现了过拟合跟欠拟合的环境。

泛化本领差的缘故因由

过拟合

过拟合就是模子太贴近于练习数据,而无法实用于真实天下的数据。
常用对策就是加大练习数据集。对于数据有限的环境,可以给数据添加噪声等,尽可能增长数据量和多样性。
欠拟合

欠拟合就是模子的学习本领差,无法从测试数据中找到数据的特性的规律。
常用的对策就是进步模子的复杂度。但比不是越复杂越好。

练习策略

k折交叉验证 k-fold cross-validation


提前停止 earlystopping

Early Stopping 就像考试时的「主动交卷体系」——当发现模子在练习题(验证集)上连续几次考不出更高分时,就果断停止练习,防止过度刷题导致死记硬背(过拟合)。

正则化 generalization

(1) L1 正则化(Lasso Regression)


L2正则化(岭回归/Ridge Regression)



范数处罚 (Norm Penalty)



权重衰减 (Weight Decay)




Dropout方法

Dropout通过在练习阶段随机抛弃(drop)一部分神经元(将其输出置零),迫使网络不依赖任何单个神经元,从而提升模子的泛化本领。
当模子在练习集表现明显优于验证集时,优先尝试增长Dropout。当代架构(如Transformer)中,Dropout仍是防止过拟合的关键组件。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 IT评测·应用市场-qidao123.com技术社区 (https://dis.qidao123.com/) Powered by Discuz! X3.4