论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
卷积和池化到底在做什么?
卷积和池化到底在做什么?
千千梦丶琪
论坛元老
|
3 天前
|
显示全部楼层
|
阅读模式
楼主
主题
1867
|
帖子
1867
|
积分
5601
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
深度学习神经网络中,卷积层和池化层是很经典且有效的操作,尤其在视觉领域,到现在为止也是很多SOTA模型中无法去除的模块,很多经典的模块,比如残差、dense、CSP、SE等等都是在这两个底子算子上展开的,可以说对于深度学习而已,卷积和池化就像0和1一样重要。在这里笔者分享一下自己对这两个算子的学习和明白,带领各人重温一下这两个经典的操作。
起首我们要知道,图像在计算机里是以数字的形式存在的,主流的图像处置惩罚框架在读取图像之后,都是以矩阵来表达。比如一张300x300像素的RGB图片,在程序中就是一个三维数组,size为300x300x3,前两个是高和宽,末了一个是RGB的三个通道。对于以往的传统机器视觉来说,对图像数组应用各种矩阵操作就可以得到想要的结果。
举个例子,我们想要获得图像中Y方向的信息而忽略X方向的信息,我们可以怎么做呢?
很简单,我们只需要对图像矩阵套用如许一个矩阵举行点乘,X方向的特征会颠末一正一反的求和而消失,Y方向的则正常保存,再颠末取绝对值后,就完备的保留的Y方向的界限信息,同样的,我们想要保留X方向的只需要如许做。
将算子矩阵旋转过来,就可以计算X方向的边缘信息了。这个时候我想你已经反应过来了,就是假如我们现在将这两张图片再相加在一起,就得到了整个图片的边缘信息了。这就是机器视觉中使用sobel算子计算边缘的逻辑,当然原方案肯定比我这个还要复杂一些。
以上的例子各人就可以看出来,图像的信息可以通过你应用什么样的矩阵去和图像矩阵举行运算来得到的,假如我们将上述的两个算子矩阵设计成一个3x3x3x2的矩阵,然后和原图举行运算,你会发现如许的操作就和卷积一模一样了,图像末了会变成300x300x2,就从原来的RGB信息,变成了XY方向信息。这里就是卷积为什么适合视觉使命的原因,因为这简直就是量身定制的算子。
接下来,我们可以对图像应用各种五花八门的算子操作,XY方向的,斜向的,均匀的,求最大值的等等等。但是人力的有穷的,数据是无穷的,我们无法设计出一套适合数据的完美算子。假如深度学习和卷积的结合出现了,我们可以初始化一个3x3x3x64的算子,这里的64就是设计的特征空间,我们希望模型可以能设计出很多种差异的信息求解算子,这里的算子内部是完全随机初始化的,通过深度学习的反向传播,自己去求解,模型自己去寻找最适合他的算子组合,这就是卷积神经网络。
但是对于现在的计算资源来说,图片照旧太大了,并且我们为了模型的充实鲁棒,在设计卷积算子的时候,特征空间也会设计的很大,一两层还好,但是层数多了算力很难cover得住。这个时候,各人反过来看看上面的图片,实在颠末算子后大部门像素都是无用,假如我们的模型是为了区分图像是X方向照旧Y方向的话,只需要在X方向做一个求和,假如X方向的图片,结果肯定是比较大的,反之Y方向的图片求和后就很小了。或者我们做一个最大值,或者均匀,就可以直接把原来的特征图降为到1这个维度,还能保留它所代表的信息。那么这就是池化层的作用了,在降低维度的条件下,保留信息。
这里我们看一下池化层的操作示意图,我们可以发现池化层是不用学习的,普遍用的比较多的是最大值池化即保留特征图中的最大信息。因为在持续的学习过程中,模型中卷积的算子已经学习到了怎样提取出我们需要的信息,所以最大值池化往往可以最大程度的保留信息。卷积背面往往会紧跟着池化,一方面是为了镌汰后续的计算量,别的一方面也是为了放大本次卷积后的特征信息。
以上就是卷积和池化在深度学习中的作用了,总结一下,卷积就是通过基本的矩阵运算去计算出图像中差异的特质信息,比如:边缘、亮度、轮廓、对比度等等,池化则是通过最大值、均匀等下采样手段对特征图举行降维,也能起到肯定的特征夸大和特征抑制的作用。假如各人有什么不一样的看法,欢迎在批评区讨论~
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
千千梦丶琪
论坛元老
这个人很懒什么都没写!
楼主热帖
SQLserver的安装
【C++】ZZ1864- 解题精讲
一文搞清UNIX/Linux与Windows文件换行 ...
StoneDB社区答疑第一期
数据湖Hudi与对象存储Minio及Hive\Spar ...
开发了一个Java库的Google Bard API, ...
C语言程序设计(一)计算机思维导论 ...
【HarmonyOS】初识HarmonyOS
学透shell 带你写常用的100个 shell 脚 ...
Cesium 几何体贴模型 sampleHeight(二 ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
快速回复
返回顶部
返回列表