α分位数和上侧α分位数的分别是啥意思
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了α分位数和上侧α分位数的分别是啥意思相关的知识,希望对你有一定的参考价值。
分位数有三种不同的称呼,即α分位数、上侧α分位数与双侧α分位数。
它们的定义是当随机变量X的分布函数为 F(x),实数α满足0 <α<1 时,α分位数是使PX< xα=F(xα)=α的数xα。
上侧α分位数是使PX >λ=1-F(λ)=α的数λ,双侧α分位数是使PX<λ1=F(λ1)=0.5α的数λ1、使 PX>λ2=1-F(λ2)=0.5α的数λ2。
分位数回归是对以古典条件均值模型为基础的最小二乘法的延伸,它用几个分位函数来估计整体模型。分位数回归法的特殊情况就是中位数回归(最小一乘回归),用对称权重解决残差最小化问题,而其他条件分位数回归则需要用非对称权重解决残差最小化。
在估计总体的平均数时,样本中的 个数全部加起来,其中任何一个数都和其他资料相独立,从其中抽出任何一个数都不影响其他资料。
因此一组资料中每一个资料都是独立的,所以自由度就是估计总体参数时独立资料的数目,而平均数是根据 个独立资料来估计的,因此自由度为n。
扩展资料
分位数采用加权残差绝对值之和的方法估计参数,其优点体现在以下几方面:首先,它对模型中的随机扰动项不需做任何分布的假定,这样整个回归模型就具有很强的稳健性。
其次,分位数回归本身没有使用一个连接函数来描述因变量的均值和方差的相互关系,因此分位数回归有着比较好的弹性性质。
分位数回归由于是对所有分位数进行回归,因此对于数据中出现的异常点具有耐抗性;第四,不同于普通的最小二乘回归,分位数回归对于因变量具有单调变换性;最后,分位数回归估计出来的参数具有在大样本理论下的渐进优良性。
参考资料来源:百度百科-分位数
参考技术A分位数有三种不同的称呼,即α分位数、上侧α分位数与双侧α分位数,它们的定义如下: 当随机变量X的分布函数为 F(x),实数α满足0 <α<1 时,α分位数是使PX< xα=F(xα)=α的数xα,上侧α分位数是使PX >λ=1-F(λ)=α的数λ,双侧α分位数是使PX<λ1=F(λ1)=0.5α的数λ1、使 PX>λ2=1-F(λ2)=0.5α的数λ2。
例如,在估计总体的平均数时,样本中的 个数全部加起来,其中任何一个数都和其他资料相独立,从其中抽出任何一个数都不影响其他资料(这也是随机抽样所要求的)。
因此一组资料中每一个资料都是独立的,所以自由度就是估计总体参数时独立资料的数目,而平均数是根据 个独立资料来估计的,因此自由度为n。
扩展资料:
百分位数,统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。
四分位数统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
第一四分位数(Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字;第二四分位数(Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字;第三四分位数(Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。第三四分位数与第一四分位数的差距又称四分位距。
分位数回归由于是对所有分位数进行回归,因此对于数据中出现的异常点具有耐抗性;不同于普通的最小二乘回归,分位数回归对于因变量具有单调变换性;分位数回归估计出来的参数具有在大样本理论下的渐进优良性。
参考资料来源:百度百科--分位数
参考技术B 例如标准正太分布,pX>x=a, 表x右侧面积,则x=Ua本回答被提问者采纳通过查询计算 SQLiteDB 的下四分位数和上四分位数
【中文标题】通过查询计算 SQLiteDB 的下四分位数和上四分位数【英文标题】:Calculate lower and upper quartile of SQLiteDB via query 【发布时间】:2013-01-09 20:45:43 【问题描述】:我想计算这些fiddle with my DB and the query中我称之为“差异”的值的上四分位数和下四分位数
如何使用 SQLite 做到这一点?
http://www.sqlite.org/contrib?orderby=date 上有一个扩展名 extension-functions.c,其中包含这些命令。
如果这足以解决我的问题?如何将它集成到我的 Windows-XAMPP 环境中?
【问题讨论】:
【参考方案1】:我已经在您的查询中计算了上四分位数和下四分位数。
请检查这个小提琴:http://sqlfiddle.com/#!2/4f1a82/31/0
基本上逻辑是:
上四分位数 == 平均值(“最高数字”AND 平均值(“整个数据”)) 下四分位数 == 平均值(“最低数字”AND 平均值(“整个数据”))因此添加的查询逻辑是:
((MIN(diff)+ AVG(diff)) / 2) AS lowerQuartile,
((MAX(diff)+ AVG(diff)) / 2) AS upperQuartile,
【讨论】:
嗨@Michael Meier,如果这有帮助,请告诉我。 你好,谢谢你的回答,但是第一个四分位数应该是21,中位数应该是30,第三个四分位数应该是70。我没有见过这种计算第一和第三的方法四分位数之前...你确定它是正确的吗? 不,这不会正确计算四分位数。见en.wikipedia.org/wiki/Quartile,一般来说四分位数与均值无关。【参考方案2】:我发现了一个基于this blog post 的rather unpleasant approach - 基本上,使用 GROUP_CONCAT 按顺序列出所有值,并使用子字符串函数提取第 25 或第 75 个百分位数的值。
【讨论】:
【参考方案3】:这里有 2 个计算上四分位数 (Q3) 的版本:
选项 1: 计算 Q3 位置并获得其间值的平均值。 http://sqlfiddle.com/#!3/29f19/5 来源:How to Calculate the Upper Quartile
选项 2(更准确): 计算 Q3 位置并对最近的位置赋予更多权重(插值)。这种方法与 MS Excel 中的QUARTILE.EXC
相同。
http://sqlfiddle.com/#!3/29f19/6
注意:如果您想实现使用 N-1 的 QUARTILE
/QUARTILE.INC
,您可以通过减小大小而不是增加大小来实现。 SELECT @Q3_POS = 0.75*(COUNT(*)-1.00) from [Table1]
来源:Why Excel has Multiple Quartile Functions and How to Replicate the Quartiles from R and Other Statistical Packages
更多测试:
http://sqlfiddle.com/#!3/ca246/1位置接近上限值(Q3位置:6.75) http://sqlfiddle.com/#!3/ef046b/1 居中位置 (7.5) http://sqlfiddle.com/#!3/e2a49/1位置接近下限值(8.25) http://sqlfiddle.com/#!3/5f48c/1 准确位置 (9)【讨论】:
以上是关于α分位数和上侧α分位数的分别是啥意思的主要内容,如果未能解决你的问题,请参考以下文章