SPSS - 返回最大值(列)的宏变量

Posted

技术标签:

【中文标题】SPSS - 返回最大值(列)的宏变量【英文标题】:SPSS - Macro variable that returns max(column) 【发布时间】:2016-11-24 23:24:04 【问题描述】:

我是 SPSS 宏的初学者,但我找不到任何关于宏变量的一般指南(我显然尝试过 Raynald Levesque 的网站)。

所以我正在尝试编写一个宏变量,它可以为我提供一列的最大值。这个专栏叫做 anmois 这是我写的:

    SET MPRINT=yes /PRINTBACK=yes.
    DEFINE !max (anmois)
    !LET !max = !max(anmois)
    !ENDDEFINE.

它不起作用。任何帮助将不胜感激。

谢谢。

【问题讨论】:

【参考方案1】:

您可以使用旧的 skool Ugly Hack 方法或 Python 来实现此目的。我赞同 Jons (JKP) 的 cmets,如果你是第一次学习宏,最好直接跳到 Python。

我为以下两种方法提供了解决方案。

/* Generate demo data*/.
DATA LIST LIST
/ ID V1.
BEGIN DATA.
1, 4.56
2, 6.85
3, 7.75
END DATA.
DATASET NAME dsDemo.

原生 SPSS 'Ugly Hack' 方法:

/* Using AGGREGATE obtain max value*/.
DATASET DECLARE dsAggMax. 
AGGREGATE OUTFILE=dsAggMax /V1_Max=MAX(V1).


/* Using WRITE OUTFILE generate the appropriate syntax to define max value as a macro variable*/.
DATASET ACTIVATE dsAggMax.
DO IF $CASENUM=1. 
WRITE OUTFILE='C:\Temp\macro var.sps' /  "DEFINE !MyV1Max()", V1_Max (F8.3), " !ENDDEFINE.".
END IF.
EXECUTE.

/* Run the generated syntax file*/.
INSERT FILE='C:\Temp\macro var.sps'.

/*Use the defined macro in whatever context you wish*/.
DATASET ACTIVATE dsDemo.
COMPUTE IsMax_1WrtSyn=V1=!MyV1Max.

Python 方法:

BEGIN PROGRAM PYTHON.
import spssdata
#Step1: Get all values in from desired variable V1
s1=spssdata.Spssdata("V1", names=False, convertUserMissing=True, omitmissing=True).fetchall()
print s1 #[(4.56,), (6.85,), (7.75,)]

#Step 2:  Retrieve just the first item holding the data value from each tuple
s2=[i[0] for i in s1]
print s2 #[4.56, 6.85, 7.75] 

#Step 3: Get the maximum value from these values
s3=max(s2)
print s3 #7.75

#Step 4a: Use this maximum value stored in a python variable to execute desired job
spss.Submit("COMPUTE IsMax_2Py=V1=%(s3)s." % locals())

#Alternatively

#Step4b: Create a DEFINE macro variable storing the max value to use outside of python and in native SPSS syntax

spss.SetMacroValue("!MyV1Max_PyGen", s3)
END PROGRAM PYTHON.

/* Use the python generate macro in Step4b outside of python*/.
COMPUTE IsMax_3PyGen=V1=!MyV1Max_PyGen.

【讨论】:

好的,我明白了,非常感谢!我想我认为宏像 VBA 一样工作...... 不是这么简单的比较。但正如 Eli-k 总结的那样,SPSS 中的宏仅仅是为语法处理生成字符串,而不是读取数据。【参考方案2】:
    没有宏函数!max,因此没有理由假设您的宏会做任何事情。 宏函数本身并不操作或分析数据 - 它们只创建语法,然后由语法进行操作和分析。 您不需要宏来计算列的最大值 - 使用 aggregate 函数。如果您仍然想通过宏来执行此操作,请让宏创建聚合函数。

【讨论】:

1.所以你不能在宏中使用常规的 SPSS 函数(如 max()、concat() 等)?这很奇怪,因为我不明白聚合之类的命令和 max() 之类的函数之间的区别。对我来说,它们都是命令。 SPSS 宏命令用于自动创建语法,例如您可以创建一个复杂的过程,包括aggregatemax() 以及任何其他语法命令,然后在您希望的任何时候使用一个宏调用来运行它。所以所有的宏命令都是关于创建语法的文本,有些类似于用于文本操作的常规语法,但它们都没有真正触及数据。因此宏为aggregatemax() 创建语法,但这些命令不是宏语言的一部分,也不是宏的一部分。【参考方案3】:

如果您刚开始使用宏,我建议您改为学习 Python for SPSS。它更强大。您可以从 IBM Predictive Analytics Community 网站下载 Programming and Data Management 一书。它展示了如何将该语言用于典型的 SPSS 任务。所有功能的详细信息也可以在帮助中找到。

宏文档不是很好,但您可以在 DEFINE 下阅读它,以及在帮助菜单中访问的命令语法参考的后面部分中阅读它。

【讨论】:

以上是关于SPSS - 返回最大值(列)的宏变量的主要内容,如果未能解决你的问题,请参考以下文章

从大型数据集中提取最小/最大/平均数据的宏

spss分割点怎么找

如何用spss计算点二列相关

SPSS+因子分析

pandas使用nlargest函数返回特定数据列中前N个最大值(搜寻最大的n个元素)pandas使用nlargest函数返回特定数据列中前N个最大值所对应的数据行

spss怎么进行列联分析