论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
数据库
›
分布式数据库
›
呆板学习—测量纯度
呆板学习—测量纯度
悠扬随风
金牌会员
|
2024-12-5 11:45:25
|
显示全部楼层
|
阅读模式
楼主
主题
846
|
帖子
846
|
积分
2538
如果示例都是猫或单个类,那就很纯净了,如果不是猫,那也很纯洁,但如果介于两者之间,该如何量化这组例子有多纯粹,看看熵的定义。
熵——它是对一组数据杂质的度量。
给出一组像这样的六个例子,有三只猫和三只狗,我们把p定义为猫的例子分数,这是带有标签的示例分数,以是在本例中,P1=3/6,我们将测量一组例子的杂质,利用一个叫做熵的函数,如下所示,熵函数通常表示为这个数字的大写H(p1),函数看起来很像这条曲线,横轴是p,样本中猫的比例,垂直轴是熵的值,以是在这个例子中,其中P1=0.5,P1的熵值等于1,可以看出,当例子是50时,这条曲线是最高的,以是它是最不纯洁的,相比之下,你的一组例子要么都是猫,要么都不是猫,那么熵为0。
这里有一组不同的例子,有五只猫和一只狗,以是P1=5/6≈0.83,可以发现,它的熵约莫为0.65,下一个例子,六张图片的样本都是猫,以是P1=6/6=1,熵是最后的点是零,以是,可以看出杂质从1降到零,换句话说,纯度进步。
另一个有两只猫和四只狗的样本,以是P1=2/6=1/3≈0.33,H(p1)=0.92,这其实挺不纯洁的,最后一个例子,如果我们有六只狗,那么P1=0,H(p1)=0,以是这是一个零和纯度大概这将是一个完全纯粹的集合,不是所有的猫或狗。
让我们看看P1的熵函数H的实际方程,追念一下,P1是等于猫的例子的一小部分,以是如果你有两三只猫的样本,那么这个样本必须有三分之一不是猫,以是定义P0等于不是猫的粒子的分数,以是P0=1-P1,然后将熵函数定义为-logP1,一个留意事项,P1或P0等于0,像这样的表达式看起来像零,
零的对数等于零。
熵函数是一组数据杂质的度量,从零开始上升然后又回到零,作为样本中正面例子比例的函数,还有其他雷同的函数,从零上升到1然后下降。这对于构建决策树也很有效。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
悠扬随风
金牌会员
这个人很懒什么都没写!
楼主热帖
(8) PyQt 设计并实现【工厂扫码装箱系 ...
王心凌再次爆火,为了防止收费,我连夜 ...
Java Long类parseLong()方法具有什么功 ...
【Web前端】HTML详解(上篇)
命题逻辑等值演算
Uniapp进行APP打包——iOS 系统 ...
互联网官方协议标准(rfc5000) ...
IDEA: 如何导入项目模块 以及 将 Java ...
Oracle ORA-10917: TABLESPACE GROUP c ...
RadonDB MySQL Kubernetes 2.2.0 发布 ...
标签云
存储
挺好的
服务器
快速回复
返回顶部
返回列表