置信椭圆与R画法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了置信椭圆与R画法相关的知识,希望对你有一定的参考价值。

参考技术A

在二维或者更高维的空间里,数据的聚类往往需要添加一个“置信区间”。仿照一维空间的数据,置信区间往往相对于点估计而来的,在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的测量值的可信程度,一般我们用95%置信区间来表示。
那么二维空间的数据也是如此,二维空间的置信区间往往利用置信椭圆来描述,展现真实值的可信程度,一般我们用95%置信椭圆来表示。
为什么是置信椭圆呢, 往往是因为我们的而数据分布形似椭圆

本文若无特殊说明,椭圆的中心都在左边原点,与图片略微不符

我们先看最简单的,轴对齐型的,比方说椭圆长轴平行于x轴

我们首先计算随机变量x和y的协方差矩阵,根据协方差矩阵计算该矩阵的特征向量(上图绿色为椭圆短轴方向的特征向量;粉红色为椭圆长轴方向的特征向量),我们定义椭圆长轴方向的特征向量为v1,椭圆短轴方向的特征向量为v2;而特征向量大小为特征值,我们定义椭圆长轴方向的特征值为λ1,椭圆短轴方向的特征值为λ2。
此时椭圆的长轴为:

椭圆的短轴为:

有了上面的介绍,那么任意位置的椭圆无非是满足数据中心不在原点,且椭圆长轴与x轴正方向夹角为任意角α。并以此来建立椭圆方程,画出置信椭圆(可见数据中心化可以简便很多计算)

如果是利用ggplot画置信椭圆,例如对PCA或者PCoA降维后的二维结果进行画图
我们利用 stat_ellipse() 画置信椭圆

或者利用一些R包“car”来画

参考:
置信椭圆原理1
置信椭圆原理2
ggplot画置信椭圆
car画置信椭圆

怎样动态演示椭圆的画法?

根据椭圆的定义,可以知道画椭圆的方法有很多,那么要怎么演示动态画椭圆呢?这就需要借助专业的画图软件几何画板了,下面就来学习具体绘制方法。

技术图片

几何画板是一个优秀的专业学科平台软件,代表了当代专业工具平台类教学软件的发展方向。比如在学习椭圆圆锥曲线知识时,如果仅依靠黑板教学,是没法动态演示椭圆的,只能按照椭圆数据按部就班的绘图,但是如果利用几何画板,就可以动态演示画椭圆过程,而且还可以对椭圆的高度进行控制,下面就一起学习画动态画椭圆的方法。

几何画板软件免费获取地址:http://www.jihehuaban.com.cn/xiazai.html

几何画板制作的演示画椭圆课件样图:

技术图片
几何画板课件模板——动态演示画椭圆

在该课件中,只需点击“画椭圆”文本按钮,就可以演示用笔在画板上画出椭圆的过程;点击“复位”文本按钮,就可以恢复到初始化状态,以便再次进行演示。如果对椭圆的大小不满意,该课件中还可以进行调节,只需修改表示控制椭圆高度的参数,就可以改变椭圆大小。

椭圆是平面上到两定点的距离之和为常值的点之轨迹,也可定义为到定点距离与到定直线间距离之比为一个小于1的常值的点之轨迹。它是圆锥曲线的一种,即圆锥与平面的截线。在数学中,椭圆是平面上到两个固定点的距离之和是同一个常数的轨迹。这两个固定点叫做焦点。它是圆锥曲线的一种,即圆锥与平面的截线。 椭圆在方程上可以写为标准式x2/a2+y2/b2=1。

有了该课件,就可以用来演示动态画椭圆的全过程,方便学生们直观观看。除此之外,根据椭圆的第二定义,还可以制作动画,具体可参考:几何画板中如何用椭圆第二定义画椭圆

以上是关于置信椭圆与R画法的主要内容,如果未能解决你的问题,请参考以下文章

R语言主成分分析(PCA)加“置信椭圆”

怎样动态演示椭圆的画法?

CAD制图系列之椭圆画法标注

数学中常用几何画板绘制椭圆

R语言使用cor函数计算相关性矩阵进行相关性分析,使用corrgram包可视化相关性矩阵行和列使用主成分分析重新排序下三角形中使用平滑的拟合线和置信椭圆,上三角形中使用散点图对角线最小值和最大值

如何将数据椭圆叠加在 ggplot2 散点图上?