【机器学习第一期】决策树原理及实现步骤:含MATLAB/Python实现代码
1 原理决策树(Decision Tree)是一种基于树形结构进行决策分析的方法。它利用树形结构来表示各种决策效果之间的关系,而且可以用于分类和回归分析等任务。其关键头脑是通过递归地分别数据集,找到最优的特征及其分别点,使得子数据集尽大概纯净(即目标变量具有较小的方差或熵)。
决策树的构建过程可以分为两个步骤:
[*]第一步是选择一个符合的分别属性,将数据集分别成多个子集;
[*]第二步是针对每个子集递归地重复进行第一步,直到全部的子集都属于同一类别大概达到了预定义的停止条件。
在决策树的构建过程中,需要选择一个符合的分别属性。常见的分别属性选择方法有信息增益、信息增益比、基尼指数等。在选择分别属性时,通常选择对分类效果的影响最大的属性,以达到最优的分别效果。
决策树的优点包括易于明白和表明、计算复杂度低等。同时,决策树也有一些缺点,比如轻易过拟合、对数据的噪声和异常值敏感等。
https://i-blog.csdnimg.cn/direct/3fc301d4b9a44d7cbecf864cd275d327.png#pic_center
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]