第五节 算法的分类介绍和数据集的划分

Posted kogmaw

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第五节 算法的分类介绍和数据集的划分相关的知识,希望对你有一定的参考价值。

"""
机器学习算法分类:
    监督学习(有目标值)
        分类(目标值是离散型数据):K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
        回归(目标值是连续型数据):线性回归、岭回归
    无监督学习(无目标值):聚类 K-means
机器学习一般会把数据集划分为训练集(3/4)和测试集(1/4),可以使用sklearn中的train_test_split模块进行自动分类
"""

# 使用sklearn自带的鸢尾花数据集进行数据划分
from sklearn.datasets import load_iris  # 鸢尾花模块
from sklearn.model_selection import train_test_split  # 选择测试集模块

li = load_iris()
# li.data特征集,li.target目标集,test_size测试集占比
print(li.data)
print(li.target)
x_train, x_test, y_train, y_test = train_test_split(li.data, li.target, test_size=0.25)

print("训练集的特征值和目标值:", x_train, x_test)
print("测试集的特征值和目标值:", y_train, y_test)

 

以上是关于第五节 算法的分类介绍和数据集的划分的主要内容,如果未能解决你的问题,请参考以下文章

无监督第五节:LDA (Latent Dirichlet Allocation算法细节)(主题模型)

(计算机组成原理)第五章中央处理器-第五节2:指令流水线影响因素和分类及多发技术

软件构造 第七章第五节 测试

数据链路层-第五节3:轮询访问介质控制之令牌传递协议

Oracle学习笔记之第五节网络介绍

第五节算法