统计尺度包括哪些类型

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了统计尺度包括哪些类型相关的知识,希望对你有一定的参考价值。

统计从业资格认定办理指南
项目名称
统计人员从业资格认定

实施机关
省级人民政府统计行政主管部门
审批类型
审批内容
统计人员从业资格
依据及全文
一、《国务院对确需保留的行政审批项目设定行政许可的决定》(国务院第412号令)
二、《中华人民共和国统计法》(中华人民共和国主席令第65号)
三、《统计从业资格认定办法》(国家统计局令第8号)
办理条件
一、申请人需具备下列基本条件:
⑴遵守国家法律、法规;
⑵坚持原则,具备良好的道德品质;
⑶具备从事统计工作所需的专业知识和技能。
二、申请人提交的材料真实、齐全、规范、有效。
办理程序
统计从业资格认定办理程序
办理时限
依据行政许可法要求,按照各地方政府相关规定。
报送材料目录
一、领取并填写《统计从业资格申请表》一式两份;
二、本人居民身份证原件及其两份复印件;
三、统计从业资格考试合格成绩单原件及其复印件两份或本人合格学历证书原件及其复印件两份;
四、本人近期小2寸正面免冠彩色照片1张。
收费标准及依据
免费

承办部门的导航
各地、县统计机构

联系方式
各地、县统计机构

办理地点情况
各地、县统计机构

办理结果公开
各地、县统计机构
参考技术A 米 分米 厘米 千米 光年 参考技术B 统计方法:
1)测量的尺度
统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目,顺序,等距,等比)在统计过程中具有不等的实用性 。等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的,等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(如智力或温度的测量)。( Ordinal measurements)顺序尺度的意义并非表现在其值而是在其顺序之上。名目尺度(Nominal measurements)的测量值则不具量的意义。
1.与数据相关的几个基本概念:
个体:收集数据时所依据的对象。【数据库中的关键字】
变量:对个体所感兴趣的特征。【属性】
观察值:对某个体收集到的测量值的全体。【测量值表全体】
观察值是对数据集中每个个体的各个方面进行测量所得的集合。因此它的个数总是等于个体的数量,每个个体的测量值个数等于变量的个数。数据总数=个体数*变量数。

2.对数据的测量尺度:
名义尺度:用于确认个体属性的标签或者名称。
顺序尺度:数据以名义数据显示,但数据顺序或等级之间的差异有意义。【如对于服务质量测量:优秀、良好、较差;对酒店的1-5星级的划分;班级中上成绩排名】
区间尺度:数据具有顺序数据所有的特征,并以相同的刻度或单位表示数值间的间隔。它总是数值型数据。【如学生的语文成绩分数】
比率尺度:数据数据具有区间数据所有特性,且两个数据的比值是有意义的,其测量尺度为比率尺度。

3.统计数据类型
在统计学中,统计数据主要可分为四种类型,分别是定类数据,定序数据,定距数据,定比变量。
1.定类数据(Nominal):名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系。【例如, ”性别“,”男“编码为1,”女“编码为2。 】
2.定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。【例如,“受教育程度”,文盲半文盲=1,小学=2,初中=3,高中=4,大学=5,硕士研究生=6,博士及其以上=7。 】
3.定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。统计中经常需要这种数据来时行分析。【例如,温度。】
4.定比变量(Ratio):数据的最高级,既有测量单位,也有绝对零点。【例如职工人数,身高。】

一般来说,数据的等级越高,应用范围越广泛,等级越低,应用范围越受限。不同测度级别的数据,应用范围不同。等级高的数据,可以兼有等级低的数据的功能,而等级低的数据,不能兼有等级高的数据的功能。

中国统计网中有一博文提到了如下分类:
1.按计量尺度分类

分类数据:只能归于某一类别的非数字型数据。【根据特征划成类。可以使用名义尺度或者顺序尺度】——分类变量
顺序数据:只能归于某一有序类别的非数字型数据。
数值型数据可能是离散的也可能是连续的。如泊松分布描述的数据是离散的,正态分布等描述的数据是连续的。

2.按收集方法分类

观测数据:通过调查和观测而收集到的数据。
实验数据:在实验中控制实验对象而收集到的数据。

3.按时间状况分类

截面数据:在相同或近似相同时间点上收集的数据。
时间序列数据:在不同时间上收集到一段时间内的数据。
参考技术C 统计学概述:
  统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。
  统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。

统计方法:
  1)测量的尺度
  统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目,顺序,等距,等比)在统计过程中具有不等的实用性 。等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的,等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(如智力或温度的测量)。( Ordinal measurements)顺序尺度的意义并非表现在其值而是在其顺序之上。名目尺度(Nominal measurements)的测量值则不具量的意义。
  2)统计技术
  以下列出一些有名的统计检定方法以及可供验证实验数据的程序
  费雪最小显著差异法(Fisher's Least Significant Difference test )
  学生t检验(Student's t-test)
  曼-惠特尼 U 检定(Mann-Whitney U)
  回归分析(regression analysis)
  相关性(correlation)
  皮尔森积矩相关系数(Pearson product-moment correlation coefficient)
  史匹曼等级相关系数(Spearman's rank correlation coefficient )
  卡方分配(chi-square )

特征,特征不变性,尺度空间与图像金字塔

博客:blog.shinelee.me | 博客园 | CSDN

特征

在计算机视觉领域,特征是为了完成某一特定任务需要的相关信息。比如,人脸检测中,我们需要在图像中提取特征来判断哪些区域是人脸、哪些区域不是人脸,人脸验证中,我们需要在两个人脸区域分别提取特征,来判断他们是不是同一个人,如下图所示,深度神经网络最终得到一个128维的特征用于识别等任务,图片来自Openface

技术分享图片

常用的特征包括:图像灰度or灰度、直方图、梯度、边缘、纹理、矩、SIFT、深度学习特征等等。以关键点特征为例,关键点指的是可以稳定出现的特殊点,如角点、局部极值点等,如上图中人脸中眼鼻口处的关键点,先检测图像中的关键点,然后在以该点为中心的邻域范围内提取信息,作为该点的特征描述。关键点特征的好处在于,关键点可以稳定复现同时其特征描述聚焦在关键点邻域内,对遮挡、形变等有很好鲁棒性。以SIFT描述子为例,其将关键点周围的梯度统计直方图作为该点的特征,如下图所示,图片来自链接

技术分享图片

不同的特征适用范围也不同,有些特征对光照敏感,有些特征对形变敏感,需要根据任务场景选择适合的特征——适合的才是最好的,不是什么时候都要上牛刀。如果任务场景简单,比如明确知道光照条件不变、人脸基本正面且表情妆容没有变化,可能直接使用灰度或梯度进行模板匹配就可以识别了,但如果场景复杂,光照可能变化、表情可能变化、人脸角度也不确定,那么为了完成任务,选取的特征就需要有较好的适应性,这就要谈到特征不变性

特征不变性

技术分享图片

以上图为例,左右两图中玩具车的姿态不同、大小不同、图像亮度不同,对应局部(图中黄色小块)在各自图中的绝对位置不同、大小不同、方向不同、灰度不同,为了实现配准,就需要在局部提取的特征具有某些不变性,才能够匹配上。

  • 几何不变性(geometric invariance):平移,旋转,尺度……
  • 光度不变性(photometric invariance):亮度,曝光……

图像预处理通过对输入图像进行归一化(最大最小值归一化、均值方差归一化、直方图均衡化等),能在一定程度上做到对亮度或光照鲁棒。此外,在设计特征提取算法时,通过考虑相对信息和统计信息(比如梯度、直方图等),降低对灰度(颜色)绝对值的敏感度,可以进一步做到对亮度或光照鲁棒

通过使用局部窗口内的像素信息和相对位置信息局部特征一般都能做到平移无关。要做到旋转无关,则需要将窗口以某个主方向对齐后再提取局部特征,如图中倾斜的黄色小块,主方向可以是窗口内最集中的梯度方向。

接下来,讲述一下如何做到尺度无关

尺度空间

尺度,可以通过地图的比例尺来理解,如下图所示,如果以100米为单位进行观测(称为图100),箭头处有一个角点A,如果以5米为单位进行观测(成为图5),则A附近多了一个凹陷B,而这个凹陷B在图100中是看不见的,为什么呢?尺度空间理论认为是被平滑掉了,即低尺度下可以看清细节,高尺度下细节会被平滑掉只剩下更“宏观”的特征,因此可知

  • 特征是有尺度的,在某个尺度下B是关键点(图5中),但在更大的尺度下可能就不是了(图100中)
  • 需要在对应的尺度下提取特征,既然B仅在图5的尺度下是关键点,其特征自然需要在图5的尺度下提取

技术分享图片

如果两幅图像的尺度不同该如何匹配?图100和图5中的A是同一个点,但因为尺度不同,邻域差异很大,在各自的邻域中提取的特征自然不同,为了让它们能匹配上,需要对图5构建尺度空间,获得不同尺度下的表达,具体怎么做呢?保持图5图像尺寸不变,不断(高斯)平滑,直到B处的凹陷平滑没了(与图100相似),达到与图100相近的尺度,图100中在A邻域内(比如(10 imes 10))提取特征(比如SIFT),图5中在A邻域内((200 imes 200))提取特征,两者在各自图像中提取的SIFT特征长度相同(将领域划分成同样数量的子区域,然后在子区域中统计梯度直方图,某种程度上讲是对邻域窗口的归一化后再提取特征),这样就可以匹配上了。

平滑类似如下过程,最下面一行为原始信号,每一行对应一个尺度:
技术分享图片

一般来讲,在没有先验知识的情况下,对两幅图像分别在每个尺度上检测关键点并提取特征,总有某些关键点及其特征正好来自相同的尺度,如果它们恰好可以匹配上,则图像1和图像2匹配,反之,如果所有关键点都配不上,则图像1和图像2不匹配。

小结一下:尺度空间,是在信号长度不变的情况下(如上图(f(x))(f^t(x))),通过(高斯)平滑,获得信号在不同尺度下的表达,然后使用尺度对应大小的窗口进行观测和提取特征。因为获得了原始信号在所有尺度下的特征,这些特征在整体上做到了尺度无关——因为原始信号各种尺度的特征都有了。

图像金字塔

尺度空间中,不同尺度下观测窗口的像素尺寸是不同,还有另外一种情况,保持观测窗口大小不变,让图像尺寸发生变化。以人脸检测为例,通常训练结束后,方法中用到的滤波器、卷积核的参数和尺寸就固定了,因此提取到的特征只适用于检测像素大小在某个范围内的人脸,超出这个范围的人脸就检测不出来了。但是,在没有先验知识的情况下,输入图像中人脸的像素大小是未知的,不同输入图像中人脸的像素尺寸也可能不同,怎么办?这是就要用到图像金字塔,如下图所示,使用RCNN检测人脸,图像中的人脸有大有小,通过构建图像金字塔来检测,图片来自链接

技术分享图片

构建图像金字塔,是为了获得图像在不同尺寸(不同分辨率)下的表达,通过不断重复 平滑+下采样 的过程(也有通过插值Resize),获得了不同像素尺寸的人脸图像,其中只要有与网络适配的人脸就可以被检测出来。

小结一下:图像金字塔,是在保持观测窗口不变的情况下,获得输入图像在不同尺寸(分辨率)下的表达,在不同尺寸上提取到的特征在整体上做到了尺寸(分辨率)无关。实际使用中,一般采用2倍下采样,即金字塔中图像长宽逐层折半。

细心的读者可能已经发现,尺度空间和图像金字塔存在着某种关联,有种一体两面的感觉,实际上两者可以联合在一起使用,我们以后再谈。

总结

本文的重点在于讲述 几种特征不变性以及实现特征不变性的途径,对尺度空间和图像金字塔只是做了直观的介绍,后面会单独写文章详细讲解。

参考


以上是关于统计尺度包括哪些类型的主要内容,如果未能解决你的问题,请参考以下文章

ClusterMap:用于空间基因表达的多尺度聚类分析 空间转录组分析工具推荐

spss1

图表类型都有哪些呢?

防火墙包括哪些类型?

防火墙包括哪些类型?

统计数据类型与对应的相关性分析方法