计算跨多个变量的频率 SPSS
Posted
技术标签:
【中文标题】计算跨多个变量的频率 SPSS【英文标题】:Computing Frequencies Across Multiple Variables SPSS 【发布时间】:2017-04-24 02:29:48 【问题描述】:我正在利用全国出院的大型数据集开展一项临床研究项目。我们正在使用 SPSS 进行统计分析。
数据集包含 25 个诊断变量 (DX1-DX25),每次出院最多可捕获 25 个诊断。一个病人可能有多个诊断,所以DX1是主要诊断,DX2是次要诊断,以此类推。
DXn 变量是包含 ICD-9 代码的字符串变量。 ICD-9 是用于对疾病进行分类的诊断代码系统。
我们想知道所有 25 个诊断变量中的 10 个最常见的诊断(ICD-9 代码)。有没有办法在 SPSS 中对所有 25 个诊断变量进行频率分析?换句话说,我想要一个频率表来显示每个 ICD-9 代码的组合频率/出现。
谢谢!
【问题讨论】:
【参考方案1】:如果您有权访问自定义表 (CTABLES) 程序,您可以定义一个多类别集(分析 > 表 > 多重响应集,并使用自定义表程序将集合中的所有变量制成表格。无论变量是字符串或数字。
【讨论】:
【参考方案2】:您可以重组(在一个变量中获得所有诊断),然后使用简单的频率分析:
varstocases /make DX from DX1 to DX25.
freq DX.
您应该在单独的数据集中执行此操作并保留原始数据集结构。例如:
dataset name OrigData.
dataset copy ForRestr.
dataset activate ForRestr.
varstocases .....
freq ....
dataset activate OrigData.
【讨论】:
如果 DX 变量是带有关联值标签的数字,您可以使用多个响应组。像MULT RESPONSE GROUPS=$DX (DX1 TO DX25 (1,100)) \FREQUENCIES $DX.
这样的东西如果是字符串,你可以使用MRSETS
,但是你需要使用CTABLES
而不是FREQUENCIES
。
@AndyW,为什么不将此作为答案发布?顺便说一句,根据问题“DXn 变量是字符串变量”。以上是关于计算跨多个变量的频率 SPSS的主要内容,如果未能解决你的问题,请参考以下文章
SQL percentile_cont vs SPSS 频率百分位数
R语言使用table函数计算单分类变量的频率表(frequency table)使用prop.table函数将table函数计算获得的频率表转化为比率表返回单分类变量每一个类别的比率或者百分比