机器学习之填空题

Posted 2022-01-25 寂静花开

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习之填空题相关的知识，希望对你有一定的参考价值。

点击查看答案

1、一行数据我们称为一个 ___
2、一列数据我们成为一个 ___
3、按照数据集的目标值不同，可以把模型评估分为分类模型评估和______
4、模型评估用于评价训练好的的模型的表现效果，其表现效果大致可以分为两类：____和___
5、模型学习的太过粗糙，连训练集中的样本数据特征关系都没有学出来，这种情况我们可以判断可能出现了___问题。
6、所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在测试数据集中表现不佳，这种情况我们可以判断可能出现了_____问题。
7、在分类模型评估中，预测正确的数占样本总数的比例，我们称其为_____
8、k-近邻算法，也叫 ____ 算法，是一个非常适合入门的算法。
9、K-近邻算法善于解决 _____ 中的分类问题。
10、在K-近邻算法中将数据集进行切分的函数，可用sklearn中的 ____ () 函数。
11、在线性回归API：sklearn.linear_model.LinearRegression(fit_intercept=True)中有两个重要的属性，回归系数：LinearRegression.____和偏置：LinearRegression._____
12、sklearn.linear_model.LinearRegression()是 ____优化方法
13、sklearn.linear_model.SGDRegressor()是 ____优化方法
14、岭回归是线性回归的正则化版本，它采用了____正则化。
15、Lasso 回归是线性回归的另一种正则化版本，它采用了____ 正则化。
16、在sklearn中模型的保存后的后缀名是 ____
17、机器学习的数据集一般会划分为两个部分：训练集和___________。
18、逻辑回归是机器学习中的一种___________模型。
19、逻辑回归中的激活函数（sigmoid函数），默认阈值为___________。
20、逻辑回归模型sklearn.linear_model.LogisticRegression(solver='liblinear', penalty=‘l2’, C = 1.0)中参数C的含义是___________。
21、逻辑回归中的评价指标F1-score，反映了模型的___________性。
22、ROC曲线的横轴是FPRate即___________。
23、ROC曲线的纵轴是TPRate即___________。
24、聚类算法是一种典型的___________学习算法，主要用于将相似的样本自动归到一个类别中。
25、聚类算法分为粗聚类和___________。
26、聚类算法API：sklearn.cluster.KMeans(n_clusters=8)中的参数n_clusters表示___________。
27、聚类算法模型评估中的SSE（The sum of squares due to error）中文意思是___________。
28、聚类算法中K值的确定，我们常用___________方法。
29、聚类算法中___________结合了聚类的凝聚度（Cohesion）和分离度（Separation），用于评估聚类的效果。
30、在聚类算法中的主成分分析的API: sklearn.decomposition.PCA(n_components=None)，当参数n_components为小数时表示___________。
31、在聚类算法中的主成分分析的API: sklearn.decomposition.PCA(n_components=None)，当参数n_components为整数时表示___________。

1、一行数据我们称为一个 ___

样本

2、一列数据我们成为一个 ___

特征

3、按照数据集的目标值不同，可以把模型评估分为分类模型评估和______

回归模型评估

4、模型评估用于评价训练好的的模型的表现效果，其表现效果大致可以分为两类：_和

过拟合、欠拟合。

5、模型学习的太过粗糙，连训练集中的样本数据特征关系都没有学出来，这种情况我们可以判断可能出现了___问题。

欠拟合

6、所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在测试数据集中表现不佳，这种情况我们可以判断可能出现了_____问题。

过拟合

7、在分类模型评估中，预测正确的数占样本总数的比例，我们称其为_____

准确率

8、k-近邻算法，也叫 ____ 算法，是一个非常适合入门的算法。

KNN

9、K-近邻算法善于解决 _____ 中的分类问题。

监督学习

10、在K-近邻算法中将数据集进行切分的函数，可用sklearn中的 ____ () 函数。

train_test_split

11、在线性回归API：sklearn.linear_model.LinearRegression(fit_intercept=True)中有两个重要的属性，回归系数：LinearRegression.和偏置：LinearRegression._

coef_ 和 intercept_

12、sklearn.linear_model.LinearRegression()是 ____优化方法

正规方程

13、sklearn.linear_model.SGDRegressor()是 ____优化方法

梯度下降法

14、岭回归是线性回归的正则化版本，它采用了____正则化。

15、Lasso 回归是线性回归的另一种正则化版本，它采用了____ 正则化。

16、在sklearn中模型的保存后的后缀名是 ____

*.pkl

17、机器学习的数据集一般会划分为两个部分：训练集和___________。

答案：
测试集

18、逻辑回归是机器学习中的一种___________模型。

答案：分类；

19、逻辑回归中的激活函数（sigmoid函数），默认阈值为___________。

答案： 0.5；

20、逻辑回归模型sklearn.linear_model.LogisticRegression(solver=‘liblinear’, penalty=‘l2’, C = 1.0)中参数C的含义是___________。

答案：正则化力度；

21、逻辑回归中的评价指标F1-score，反映了模型的___________性。

答案：稳健；

22、ROC曲线的横轴是FPRate即___________。

答案：假阳性率；

横假纵真

23、ROC曲线的纵轴是TPRate即___________。

答案：真阳性率；

24、聚类算法是一种典型的___________学习算法，主要用于将相似的样本自动归到一个类别中。

答案：无监督；

25、聚类算法分为粗聚类和___________。

答案：细聚类；

26、聚类算法API：sklearn.cluster.KMeans(n_clusters=8)中的参数n_clusters表示___________。

答案：开始的聚类中心数量；

27、聚类算法模型评估中的SSE（The sum of squares due to error）中文意思是___________。

答案：误差平方和；

28、聚类算法中K值的确定，我们常用___________方法。

答案： “肘”；

29、聚类算法中___________结合了聚类的凝聚度（Cohesion）和分离度（Separation），用于评估聚类的效果。

答案：轮廓系数法；

30、在聚类算法中的主成分分析的API: sklearn.decomposition.PCA(n_components=None)，当参数n_components为小数时表示___________。

答案：保留百分之多少的信息；

小数：保留百分之多少的信息
整数：减少到多少特征

31、在聚类算法中的主成分分析的API: sklearn.decomposition.PCA(n_components=None)，当参数n_components为整数时表示___________。

答案：减少到多少特征；

以上是关于机器学习之填空题的主要内容，如果未能解决你的问题，请参考以下文章

机器学习 之 填空题