二维列联表适合进行双变量分析的统计表吗
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了二维列联表适合进行双变量分析的统计表吗相关的知识,希望对你有一定的参考价值。
二维列联表如果是二维列联表,那么结构就稍有不同了,我们来看下面这个例子。
mytable <- xtabs(~ Treatment+Improved, data=Arthritis) mytable margin.table(mytable, 1) prop.table(mytable, 1) margin.table(mytable, 2) prop.table(mytable, 2) prop.table(mytable)
显示的结果如下:
一般使用xtabs()来表示二维列联表,二维列联表相当于对其中两个变量进行分类统计和。比如说治疗情况是Treated,是否改善是None的样本数是13个。
简单解释一下代码:
xtabs()有两个参数,第一个参数的结构是~A+B,表示需要进行交叉分类的两个变量。其中第一个变量展示在列,第二个变量展示在行。第二个参数是数据源。
margin.table()是展现边际数据的。第一个参数是数据源,第二个参数是表示行列的,1表示按照列的类别统计和,2表示按照行的类别统计和。比方说第三行那一行代码的第二个参数是1,这就表示按照治疗情况(列上的treatment)来统计和,所以就展现了treatment的两种类别的样本个数。
prop.table()是把频数转为比例的,但是这里多了第二个参数,和上面是一样的含义。比如说第四行代码的第二个参数是1,这就表示固定(列上的treatment),以是否改善(Improved)为标记来进行比例统计,这就使得每一行的每一个单元的比例之和一定为1。
最后一行没有第二个参数,所以它表示各单元格所占的比例。反过来说,所有的单元格的比例之和一定为1。
最后,二维列联表还有一种创建方法是CrossTable(),具体的用法如下。
library(gmodels) CrossTable(Arthritis$Treatment, Arthritis$Improved)
显示的结果如下:
不过这样展示的数据会很多,而且一下子看对应会有些累。只能说各有好处了。别忘了导入gmodels包哦。 参考技术A 指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较个组的分布状况,以寻找变量间的关系 是指一种对变量间关系的测定,简称PRE。假设在不知道x的情况下,对y进行预测的全部误差是E1,在知道x的情况下,由x预测或解释y的总误差为E2,则由x预测或解释掉y的误差为E1-E2,消减误差比例PRE=(E1-E2)/E1。PRE越大,表示以x预测或解释y时所减少的误差越多,即x与y的关系越强。换言之,PRE的值表示的是用一个社会现象(x)来解释另一个社会现象(y)时,能够消除百分之几的错误,即x对y的解释力有多大。PRE的值在0与1之间,当E2=0时,PRE=1,说明x与y完全相关,x能百分之百解释y的变化;若E2=E1,则PRE=0 ,说明x与y之间没有关系,x对y无解释力 就是指两个变量间存在一种连带关系,即当一个变量的值发生变化时,另一个变量的值也相应地发生变化 就是以一个统计指标是变量与变量间的关系 参考技术B 是的。
多维两联表交互分类是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。
若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。 参考技术C 第八章二维列联表:双变量关系考察一、基本概念1、二维表二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是变量。
以上是关于二维列联表适合进行双变量分析的统计表吗的主要内容,如果未能解决你的问题,请参考以下文章