digit 手写数据库条记 (机器学习)

打印 上一主题 下一主题

主题 511|帖子 511|积分 1533

参考册本

第三章内容


digit 手写数据库

  1. # 最初的分类器
  2. # digits 手写数字库
  3. import numpy as np
  4. import matplotlib.pyplot as plt
  5. from sklearn import datasets
  6. from sklearn import tree
  7. # 性能评价相关的库
  8. from sklearn import metrics
  9. # digits 数据加载
  10. digits = datasets.load_digits()
  11. # 显示此库中第一行的数据
  12. data = digits.data
  13. print(data[0])
  14. # 将画像以2行5列表示
  15. # 前10个手写数字表示
  16. for label, img in zip(digits.target[:10], digits.images[:10]):
  17.     plt.subplot(2,5, label+1)
  18.     plt.axis('off')
  19.     plt.imshow(img, cmap=plt.cm.gray_r, interpolation='nearest')
  20.     plt.title('Digit: {0}'.format(label))
  21. plt.show()
  22. # 求 3 和 8 的位置
  23. flag_3_8 = (digits.target == 3) + (digits.target == 8)
  24. # 获取 3 和 8 的数据
  25. images = digits.images[flag_3_8]
  26. labels = digits.target[flag_3_8]
  27. # 将 3 和 8 的画像数据一次元化
  28. images = images.reshape(images.shape[0], -1)
  29. # 生成分类器
  30. n_samples = len(flag_3_8[flag_3_8])
  31. train_size = int(n_samples * 3 / 5)
  32. # 在tree.DecisionTreeClassifier中生成分类器
  33. classifier = tree.DecisionTreeClassifier()
  34. # 将学习数据给到classifier.fit
  35. # 为了简单使用了60% 的数据作为训练数据
  36. # train_size是作为训练和测试的分界点
  37. classifier.fit(images[:train_size], labels[:train_size])
  38. # 使用剩下的数据进行测试,也就是40%
  39. # 因此这里的测试数据是从 train_size 开始的
  40. # 提取测试数据的标签作为正确标签。
  41. expected = labels[train_size:]
  42. # 分类执行,取出测试数据的预测结果
  43. predicted = classifier.predict(images[train_size:])
  44. # 打印结果
  45. # accuracy_score用来计算正确率
  46. print('accuracy: \n', metrics.accuracy_score(expected, predicted))
复制代码
结果


[ 0. 0. 5. 13. 9. 1. 0. 0. 0. 0. 13. 15. 10. 15. 5. 0. 0. 3.
15. 2. 0. 11. 8. 0. 0. 4. 12. 0. 0. 8. 8. 0. 0. 5. 8. 0.
0. 9. 8. 0. 0. 4. 11. 0. 1. 12. 7. 0. 0. 2. 14. 5. 10. 12.
0. 0. 0. 0. 6. 13. 10. 0. 0. 0.]
accuracy:
0.8531468531468531

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

张国伟

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表