IT评测·应用市场-qidao123.com

标题: 【Python机器学习】3.5. 决议树实战:基于Iris数据集 [打印本页]

作者: 光之使者    时间: 2025-3-22 12:31
标题: 【Python机器学习】3.5. 决议树实战:基于Iris数据集
喜欢的话别忘了点赞、收藏加关注哦(关注即可检察全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(=・ω・=)
本文紧承 3.1. 决议树理论(底子) 和 3.2. 决议树理论(进阶),没看过的发起先看理论分析。

3.5.1. Iris数据集

这一章所讲的技术在实战时大部分都使用Iris数据集。Iris鸢尾花数据集是一个非常经典的数据集,在统计学和机器学习领域都经常被用作示例。
下面所示的这个花叫做鸢尾花:


这个数据集总共会有三种共150条记载,每类各50个数据。每条各50个数据,每条记载都有4项特征:

我们会通过花萼和花瓣的这4个特征来对花进行分类:

以下是Iris数据集里的部分数据:
花萼长度花萼宽度花瓣长度花瓣宽度属种5.13.51.40.2setosa4.93.01.40.2setosa4.73.21.30.2setosa4.63.11.50.2setosa5.03.61.40.2setosa5.43.91.70.4setosa4.63.41.40.3setosa5.03.41.50.2setosa 3.5.2. 实战前的预备工作

接下来,请你确保你的Python环境中有pandas、matplotlib、scikit-learn和numpy这几个包,假如没有,请在终端输入指令以下载和安装:
  1. pip install pandas matplotlib scikit-learn numpy
复制代码
Iris数据集在scikit-learn中内置有,不需要额外安装。
3.5.3. 读取数据及赋值操作

我们可以使用sklearn.datasets的load_iris来加载,趁便把x和y赋值:
  1. # 加载数据集  
  2. from sklearn.datasets import load_iris  
  3. iris = load_iris()  
  4. x, y = iris.data, iris.target
复制代码
3.5.4. 创建决议树

拆分训练数据

接下来我们需要对训练数据进行拆分,一部分用作训练,一部分用作测试:
  1. # 划分测试集和训练集  
  2. from sklearn.model_selection import train_test_split  
  3. x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
复制代码

倒入模型

首先我们要创建决议树模型,并使用训练集进行训练:
  1. # 训练决策树  
  2. from sklearn import tree  
  3. clf = tree.DecisionTreeClassifier(criterion='entropy', min_samples_leaf=5)  
  4. clf.fit(x_train, y_train)
复制代码

可视化决议树

接下来我们来可视化决议树:
  1. # 可视化决策树  
  2. import matplotlib.pyplot as plt  
  3. f_names = ['sepal length', 'sepal width', 'petal length', 'petal width']  
  4. c_names = ['setosa', 'versicolor', 'virginica']  
  5. tree.plot_tree(clf, filled=True, feature_names=f_names, class_names=c_names)  
  6. plt.show()
复制代码
filled=True:

feature_names=f_names:

class_names=c_names:

plot_tree是基于matplotlib动态画图的,表现图像得使用plt.show()
图片输出:

计算精确率

我们接下来会把测试集的数据传给训练好的决议树,把决议树的分类和标签做比较:
  1. # 计算模型在测试集上的准确率  
  2. accuracy = clf.score(x_test, y_test)  
  3. print(f"测试集准确率: {accuracy:.2f}")
复制代码
输出:
  1. 测试集准确率: 0.93
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 IT评测·应用市场-qidao123.com (https://dis.qidao123.com/) Powered by Discuz! X3.4