基于支持向量机的Digits手写数字识别
[*]加载查看Digits数据集,利用matshow方法将像素矩阵表现为图片。
https://i-blog.csdnimg.cn/direct/99ad6df1a2ad45acbbe0162f3ba5365f.png
结果如下:
https://i-blog.csdnimg.cn/direct/aafbb5bba87e474d8e6e91cf9b5356a0.png
利用差别核函数的支持向量机分类模型举行分类
2.1.正则化系数C的修改:
分别记录四种核函数在正则化参数C分别为0.01, 0.05, 0.1, 0.5, 1时的模型准确率。并利用网格搜索选择出最佳的模型参数和得分,最后实行交叉验证并计算模型的性能指标
https://i-blog.csdnimg.cn/direct/715136876a654abc833f9f4b06cdbdc4.png
https://i-blog.csdnimg.cn/direct/4a546a55bb7c483da6a9904f6219f3d8.png
结果如下:
https://i-blog.csdnimg.cn/direct/198fa67eee0642388228ba16f0680c06.png
2.2.多项式核下多项式维度参数degree的修改:
分别记录多项式核函数下维度参数为1, 3, 5, 7, 9时的模型准确率。
https://i-blog.csdnimg.cn/direct/ec529b47a114478ea1a09a11cc709c59.png
结果如下:
https://i-blog.csdnimg.cn/direct/75d982f02a274583a864f84d2add7daf.png
[*]sklearn中SVC函数相关参数的修改
3.1.正则化系数C的修改
分别记录四种核函数在正则化参数C分别为0.01, 0.05, 0.1, 0.5, 1时的模型准确率。
正则化参数C
0.01
0.05
0.1
0.5
1
rbf核
0.111
0.914
0.947
0.978
0.981
linear核
0.978
0.983
0.975
0.975
0.975
poly核
0.089
0.344
0.569
0.922
0.964
sigmoid核
0.328
0.894
0.919
0.942
0.931
https://i-blog.csdnimg.cn/direct/3e9a804e1af34d06a1a446a7d1194b3c.png
结果如下,并把结果记录在题目表格中:
https://i-blog.csdnimg.cn/direct/fe180fcc342c461686f600410c8f5ba1.png
3.2.多项式核下多项式维度参数degree的修改
分别记录多项式核函数下维度参数为1, 3, 5, 7, 9时的模型准确率。
维度degree
1
3
5
7
9
C=0.01
0.408
0.089
0.119
0.128
0.131
C=0.05
0.908
0.344
0.183
0.169
0.144
C=0.1
0.939
0.569
0.264
0.175
0.167
C=0.5
0.972
0.922
0.489
0.269
0.208
https://i-blog.csdnimg.cn/direct/9b14643be11a4c00942f068562fed45d.png
结果如下,并把结果记录在题目表格中:
https://i-blog.csdnimg.cn/direct/0a93df84793646d6b5cfad3854b9bae6.png
[*]绘制ROC曲线
请按照给出的代码示例编写代码,绘制数字8和9对应的两条ROC曲线。
https://i-blog.csdnimg.cn/direct/e8a0baedff9e4de781860442ae3a2b10.png
https://i-blog.csdnimg.cn/direct/82142f7649134f92a509b34b50b9fd8f.png
结果如下:
https://i-blog.csdnimg.cn/direct/245180bd46f44daeb9df448134f7b688.png
5.生存模型,利用加载的模型举行预测
https://i-blog.csdnimg.cn/direct/c908a3fe7fa247c8bf951e0c0c445dd5.png
https://i-blog.csdnimg.cn/direct/88002ac2433a4b118bcd5e7b88484b5e.png
结果如下:
https://i-blog.csdnimg.cn/direct/dd4266c938b3484a86b5786aed5f0f28.png
[*]结果分析
差别的核函数对模型精度有肯定的影响。可以看到在下表中,当正则化参数为0.01时,linear核的SVM模型准确率已经达到了0.978,sigmoid核的模型准确率较低为0.328,而其他核函数的模型准确率则非常低,可见在其他条件相同的情况下,利用差别的核函数对模型好坏有着比较大的影响。
https://i-blog.csdnimg.cn/direct/3d0bd1875cd0494aa7f4f714ee5302cc.png
差别的正则化参数对模型精度有肯定的影响。如下图所示,对于rbf核,正则化参数C为0.01时模型准确率为0.111,C为0.05时模型准确率就达到了0.914,随着C的继续增大,对模型准确率的影响逐渐减小。而对于linear核这种一开始表现就比较好的核函数,调整C的巨细对其结果的影响也是比较小的,甚至大概出现负优化,比如这里linear核的C从0.05到0.1的过程,模型准确率从0.983下降为0.975。同理,对于同一个多项式维度下的模型,差别的C也对模型的终极准确率产生了影响,并且对于差别的维度,C的影响力也不一样,这里在维度1下,C从0.01到0.05的过程对模型影响较大,而维度3下C从0.1到0.5的过程对模型的影响较大。
https://i-blog.csdnimg.cn/direct/4b402d5d2fca41e38e3bb89763aa9786.png
https://i-blog.csdnimg.cn/direct/b4d476d4c9fb45ddb03499aaef9f3bbf.png
差别的多项式阶数对模型精度也有肯定的影响。如下图所示,在C=0.05的情况下,随着维度的增高,模型的准确率在下降,并且下降速率是先快后慢的。在差别正则化参数C的情况下,初始准确率越高的模型,随着维度的增高受到的影响越小,终极的模型准确率下降的相对较少,在C=0.01的时间,一维的准确率较低,随着维度的增长,模型准确率下降,甚至出现了“触底反弹”的情况;而对于C=0.1的情况,一维准确率较高,随着维度的增大,其下降幅度相对较小。
https://i-blog.csdnimg.cn/direct/77386ab564df484dbd60144cea67f5ef.png
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]