(1)收集数据:提供文本文件
(2)准备数据:使用python 解析文本文件
(3)分析数据:使用 Matpltlib 画二维扩散图
(4)训练算法:此步骤不适用 k-近邻算法
(5)测试算法:使用海伦提供的部分数据作为测试样本,测试样本和非测试样本的区别在于:测试样本是已经完成分类的数据, 如果预测分类与实际类别不同,则标记为一个错误
(6)使用算法:产生简单的命令行程序,然后海伦可以输入一些特征数据以判断对方是否为自己喜欢的类型.
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在约会网站上使用 K-近邻算法相关的知识,希望对你有一定的参考价值。
(1)收集数据:提供文本文件
(2)准备数据:使用python 解析文本文件
(3)分析数据:使用 Matpltlib 画二维扩散图
(4)训练算法:此步骤不适用 k-近邻算法
(5)测试算法:使用海伦提供的部分数据作为测试样本,测试样本和非测试样本的区别在于:测试样本是已经完成分类的数据, 如果预测分类与实际类别不同,则标记为一个错误
(6)使用算法:产生简单的命令行程序,然后海伦可以输入一些特征数据以判断对方是否为自己喜欢的类型.
以上是关于在约会网站上使用 K-近邻算法的主要内容,如果未能解决你的问题,请参考以下文章
吴裕雄--天生自然python机器学习:使用K-近邻算法改进约会网站的配对效果