二维列联表适合进行双变量分析的统计表吗

Posted 2023-03-15

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了二维列联表适合进行双变量分析的统计表吗相关的知识，希望对你有一定的参考价值。

二维列联表

如果是二维列联表，那么结构就稍有不同了，我们来看下面这个例子。
mytable <- xtabs(~ Treatment+Improved, data=Arthritis) mytable margin.table(mytable, 1) prop.table(mytable, 1) margin.table(mytable, 2) prop.table(mytable, 2) prop.table(mytable)
显示的结果如下：
一般使用xtabs()来表示二维列联表，二维列联表相当于对其中两个变量进行分类统计和。比如说治疗情况是Treated，是否改善是None的样本数是13个。
简单解释一下代码：
xtabs()有两个参数，第一个参数的结构是~A+B，表示需要进行交叉分类的两个变量。其中第一个变量展示在列，第二个变量展示在行。第二个参数是数据源。
margin.table()是展现边际数据的。第一个参数是数据源，第二个参数是表示行列的，1表示按照列的类别统计和，2表示按照行的类别统计和。比方说第三行那一行代码的第二个参数是1，这就表示按照治疗情况（列上的treatment）来统计和，所以就展现了treatment的两种类别的样本个数。
prop.table()是把频数转为比例的，但是这里多了第二个参数，和上面是一样的含义。比如说第四行代码的第二个参数是1，这就表示固定（列上的treatment），以是否改善（Improved）为标记来进行比例统计，这就使得每一行的每一个单元的比例之和一定为1。
最后一行没有第二个参数，所以它表示各单元格所占的比例。反过来说，所有的单元格的比例之和一定为1。
最后，二维列联表还有一种创建方法是CrossTable()，具体的用法如下。
library(gmodels) CrossTable(Arthritis$Treatment, Arthritis$Improved)
显示的结果如下：
不过这样展示的数据会很多，而且一下子看对应会有些累。只能说各有好处了。别忘了导入gmodels包哦。参考技术A 指同时依据两个变量的值，将所研究的个案分类。交互分类的目的是将两变量分组，然后比较个组的分布状况，以寻找变量间的关系是指一种对变量间关系的测定，简称PRE。假设在不知道x的情况下，对y进行预测的全部误差是E1，在知道x的情况下，由x预测或解释y的总误差为E2，则由x预测或解释掉y的误差为E1-E2，消减误差比例PRE=（E1-E2）/E1。PRE越大，表示以x预测或解释y时所减少的误差越多，即x与y的关系越强。换言之，PRE的值表示的是用一个社会现象（x）来解释另一个社会现象（y）时，能够消除百分之几的错误，即x对y的解释力有多大。PRE的值在0与1之间，当E2=0时，PRE=1，说明x与y完全相关，x能百分之百解释y的变化；若E2=E1，则PRE=0 ，说明x与y之间没有关系，x对y无解释力就是指两个变量间存在一种连带关系，即当一个变量的值发生变化时，另一个变量的值也相应地发生变化就是以一个统计指标是变量与变量间的关系参考技术B 是的。
多维两联表交互分类是将两变量分组，然后比较各组的分布状况，以寻找变量间的关系。
若所考虑的属性多于两个，也可按类似的方式作出列联表，称为多维列联表。参考技术C 第八章二维列联表:双变量关系考察一、基本概念1、二维表二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是变量。

以上是关于二维列联表适合进行双变量分析的统计表吗的主要内容，如果未能解决你的问题，请参考以下文章