首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
SAAS
ToB门户
了解全球最新的ToB事件
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
微博
Follow
记录
Doing
博客
Blog
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
排行榜
Ranklist
相册
Album
应用中心
qidao123.com ToB IT社区-企服评测·应用市场
»
论坛
›
物联网/工业互联网
›
物联网
›
深度学习实行中,必要设置验证集吗?
返回列表
发新帖
深度学习实行中,必要设置验证集吗?
[复制链接]
发表于 2025-9-22 02:44:32
|
显示全部楼层
|
阅读模式
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
在
严谨的
深度学习实行中,
一般都应该设置验证集(Validation Set)
。
为什么要设置验证集?
用于超参数调解(调优)
比如学习率、网络层数、潜伏单位数、权重衰减、dropout比例等等。
练习集是用来
拟合参数
的,验证集是用来
评估当前模子是否泛化得好
的。
用于早停(Early Stopping)
深度学习中常用 Early Stopping:当验证集精确率降落或验证集丧失上升时,停止练习,防止过拟合。
制止过拟合到练习集
假如只在练习集上选最好的模子,很容易选到一个“只记住了练习数据、但是泛化很差”的模子。
验证集模仿了模子在“没见过的数据”上的体现。
模子选择(Model Selection)
假如练习了多个差别布局的模子(比如CNN、Transformer、GNN),你总得有个尺度去选哪个模子最好,而这个尺度通常就是验证集体现。
那为什么有些论文
不设置验证集
呢?
缘故原由表明1.
数据量小
样本原来就很少,划一部分做验证集,怕练习数据更不敷,导致模子拟合不充分。2.
只做展示性实行/证明原理
比如只是为了证明某个新算法有提升,用练习集+测试集就够了,不特殊夸大验证细节。3.
在交织验证(Cross-Validation)中
交织验证每轮主动分别练习+验证,不但独固定一个验证集。4.
“懒”大概不规范
特殊是一些非顶会/顶刊投稿大概开源项目,为了图快,直接用测试集当验证来选最好的模子(这种是不严谨的)。5.
明白指定测试集不可用
有些benchmark只提供练习集和测试集,测试集在
服务器
上封闭评测,这种环境下自己划验证集很难,除非再从练习集中拆一点。
总结
正式科研
、
比赛
、
论文复现
等场景,
必须设置验证集
,不能仅凭练习集选模子。
假如数据特殊小
(比如医学图像、卫星图像小样本),可以思量用
K折交织验证
取代固定验证集。
假如只有练习集和测试集
(比如某些挑战赛),可以从练习集再划一部分出来当验证集。
小Tips
常见分别比例是:
练习集:验证集:测试集 = 6:2:2
或
8:1:1
。
验证集
不能用于终极陈诉的
性能
评估
,终极结果必须在测试集上陈诉。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
返回列表
浏览过的版块
MES
盛世宏图
+ 我要发帖
登录后关闭弹窗
登录参与点评抽奖 加入IT实名职场社区
去登录
微信订阅号
微信服务号
微信客服(加群)
H5
小程序
快速回复
返回顶部
返回列表