什么是列联表分析(Contingency table analysis)?

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么是列联表分析(Contingency table analysis)?相关的知识,希望对你有一定的参考价值。

什么是列联表分析(Contingency table analysis)?

列联表(Contingency Table)(有时称为“交叉表”,crosstabs)是一种总结两个类别变量(categorical)之间关系的表。通过使用透视表函数可以很容易地为R中的变量创建一个列联表。

列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。

一般,若总体中的个体可按两个属性A、B分类,A有r个等级A1,A2,…,Ar,B有c个等级B1,B2,…,Bc,从总体中抽取大小为n的样本,设其中有nij个个体的属性属于等级Ai和Bj,nij称为频数,将r×c个nij排列为一个r行c列的二维列联表,简称r×c表。若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。

列联表又称交互分类表,所谓交互分类,是指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。

用于分析离散变量或定型变量之间是否存在相关。

列联表分析的基本问题是,判明所考察的各属性之间有无关联,即是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在r×с表中,若以pi、pj和pij分别表示总体中的个体属于等级Ai,属于等级Bj和同时属于Ai、Bj

以上是关于什么是列联表分析(Contingency table analysis)?的主要内容,如果未能解决你的问题,请参考以下文章