R: 判别分析
Posted li-20151130
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R: 判别分析相关的知识,希望对你有一定的参考价值。
判别与聚类的比较:
聚类分析和判别分析有相似的作用,都是起到分类的作用。
判别分析是已知分类然后总结出判别规则,是一种有指导的学习;
聚类分析则是有了一批样本,不知道它们的分类,甚至连分成几类也不知道,希望用某种方法把观测进行合理的分类,使得同一类的观测比较接近,不同类的观测相差较多,这是无指导的学习。
所以,聚类分析依赖于对观测间的接近程度(距离)或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果
判别分析
基本原理:从已知的各种分类情况中总结规律(训练出判别函数),当新样品进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等判别准则)。
常用判别方法:最大似然法,距离判别法,Fisher判别法,Bayes判别法,逐步判别法等。
注意事项:1. 判别分析的基本条件:分组类型在两组以上,解释变量必须是可测的;
2. 每个解释变量不能是其它解释变量的线性组合(比如出现多重共线性情况时,判别权重会出现问题);
3. 各解释变量之间服从多元正态分布(不符合时,可使用Logistic回归替代),且各组解释变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数不相同)。
相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。
应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功,学生是否被录用等等),临床上用于鉴别诊断。
参考文献:
https://blog.csdn.net/zhubo22/article/details/8194772 总述 聚类与判别之间的关系
以上是关于R: 判别分析的主要内容,如果未能解决你的问题,请参考以下文章