且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《写给程序员的数据挖掘实践指南》——第5章 分类的进一步探讨—算法评估及kNN

更新时间:2022-02-15 04:46:14

第5章 分类的进一步探讨—算法评估及kNN

写给程序员的数据挖掘实践指南
回到上一章中关于运动员的例子。在那个例子中我们构建了一个分类器,输入为运动员的身高、体重,输出为其从事的体育项目—体操、田径或篮球。

《写给程序员的数据挖掘实践指南》——第5章 分类的进一步探讨—算法评估及kNN

因此,左图的Marissa Coleman身高6英尺1英寸,体重160磅。我们的分类器能够将她正确判断为篮球运动员:

>>> cl = Classifier('athletesTrainingSet.txt')
>>> cl.classify([73, 160])

'Basketball'
而另一个身高4英尺9英寸体重90磅的人可能是体操运动员:

>>> cl.classify([59, 90])
'Gymnastics'

一旦构建了分类器,我们就可能有兴趣回答类似下述的问题:

《写给程序员的数据挖掘实践指南》——第5章 分类的进一步探讨—算法评估及kNN

怎样才能回答上述问题呢?