《管理统计学》期末备考(不挂科)
Posted ZSYL
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《管理统计学》期末备考(不挂科)相关的知识,希望对你有一定的参考价值。
知识点整理
- 简述统计学的基本概念
- 统计学的研究方法有哪些?它们有怎样的关系?
- 如何理解描述统计学和推断统计学在探索数量规律性方面的作用
- 统计学的发展阶段及特点
- 简述中心极限定理
- 假设检验的基本原理及显著水平
- 一个完整的假设检验包含的步骤
- 方差分析的基本思想和原理
- 方差分析的基本假定
- 方差分析的基本步骤
- 简述x^2(卡方)统计量的构造及计算步骤
- 拟合优度检验及如何确定x^2拟合优度检验中的自由度
- 简述列联表独立性检验的步骤
- 解释总平方和、回归平方和、残差平方和的含义
- 简述决定系数的含义和作用
- 简述相关系数显著性检验的步骤
- 什么是时间序列及分类
- 时间序列的组成因素及模型
- 对时间序列进行平滑以描述其趋势的方法
- 什么是指数
- 什么是聚类分析及作用
- 五种距离及定义
- 类间距离计算方法
- 标准化处理方法
- 因子分析的步骤
- 双因素方差分析表
- 测定季节变动的趋势-循环剔除法的基本思想和步骤
- 比较两种公式编制出来的销售量指数和价格指数的差异
- 计算可决系数R^2,并解释它的含义
- 检验回归方程的线性关系是否显著
- 检验各回归系数是否显著
- Sample Test
- 管理统计学名词解释
面向考试学习,虽然不挂科,但只是应付考试o(╥﹏╥)o
简述统计学的基本概念
统计学是研究如何收集、整理、分析和解释涉及社会、经济、管理问题的数据,并对研究对象进行统计推断的一门科学。
人们往往将统计学误解为数据资料的收集以及对这些数据作一些简单的均值、百分比等运算,或用图和表等形式加以表示。
其实这些仅是统计学工作的一小部分。统计学还包括假设检验、回归分析、时间序列分析、方差分析等许多工作。
统计学的研究方法有哪些?它们有怎样的关系?
必考(* ̄︶ ̄)
主要方法有两个:
(1) 描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2) 推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。
如何理解描述统计学和推断统计学在探索数量规律性方面的作用
描述统计学方法主要包括利用获得的数据,绘制统计图(直方图、条形图、饼图、雷达图等),并计算一些数字特征值(均值、方差、中位数、调和均值、偏态系数等)。
人们根据这些统计图可以比较直观地对研究对象的规律有一个大体的粗略的认识,而通过数字特征值则可以从数据的集中趋势、分散程度、偏态情况等方面对研究对象的存在和演变规律有一个基本的了解。
推断统计学方法主要包括利用获得的样本数据,进行区间估计、假设检验、回归分析、方差分析、时间序列分析等。
人们根据这些样本数据的分析结果,对研究对象的总体进行统计推断,包括推断研究对象的分布规律、推断不同因素间的相关性、确定多个因素间的统计关系、判断多个总体间的差异性等。
统计学的发展阶段及特点
统计学的发展经历了三个阶段:古典统计学、近代统计学、现代统计学。每个阶段的特点如下:
古典统计学:这个时代大致是从 17 世纪中叶至 19 世纪初叶,其代表学派是“政治算术派”和“国势学派”,其中,“国势学派”最早提出了“统计学”的名词。
近代统计学:大致是从 18 世纪末到 19 世纪末。著名的大数法则、最小平方法、相关与回归分析、指数分析法、时间数列分析法以及正态分布等理论都是这个时期建立和发展起来的。代表学派主要有数理统计学派和社会统计学派。
现代统计学时代:多元统计分析、现代时间序列分析、贝叶斯统计、非参数统计等。同时,各种统计软件如 SPSS、SAS、MATLAB、 R 语言在趋于完善的同时,也加大了统计分析功能,如数据挖掘功能。
简述中心极限定理
必考(* ̄︶ ̄)
假设检验的基本原理及显著水平
假设检验依据的原理是小概率原理,小概率 a 为显著性水平
一个完整的假设检验包含的步骤
必考(* ̄︶ ̄)
假设检验分为四个步骤:
(1)提出假设(原假设和备择假设);
(2)选择合适的统计量及相应的抽样分布;
(3)选择显著性水平a,确定原假设H0的接受域和拒绝域;
(4)计算检验统计量a的值(可省略)。
(5)最后做出判断(作出统计决策)。
方差分析的基本思想和原理
方差分析就是针对一定因素分析总体的各个因素水平是否有差异。通过对因素水平间方差与因素水平内方差的比较,当这两个方差的比值较小时,方差分析的结果可以认为总体均值相同,否则,方差分析的结果可以认为总体均值不相同。
方差分析的基本假定
方差分析的前提条件是讨论的总体服从正态分布,其各个总体的方差相等,并且选择的样本是相互独立的。
方差分析的基本步骤
方差分析的步骤
(1)建立原假设和备择假设;
(2)选择显著性水平;
(3)确定决策点;
(4)计算并作出决策
简述x^2(卡方)统计量的构造及计算步骤
拟合优度检验及如何确定x^2拟合优度检验中的自由度
简述列联表独立性检验的步骤
解释总平方和、回归平方和、残差平方和的含义
好像考(* ̄︶ ̄)
简述决定系数的含义和作用
相关系数的平方是决定系数,其衡量的是变量y中有多大比例能用变量x来解释。
简述相关系数显著性检验的步骤
什么是时间序列及分类
时间序列是指一个变量的观测值按照时间顺序排列而成的序列,它反映了现象动态变化的过程和特点,是研究事物发展趋势、规律以及进行预测的依据。
按照观察值的表现形式,时间序列可以分为绝对数时间序列、相对数时间序列和平均数时间序列。
时间序列的组成因素及模型
时间序列的组成因素包括长期趋势,季节波动,循环波动和不规则波动这四种,其中前三个是系统的,最后一个是非系统的。
在统计学上,时间序列一般有两种模型:乘法模型和加法模型。
乘法模型是假设时间序列各个构成部分对序列的影响均按照比例变化。
加法模型是假设这四种因素对时间序列的影响是可加的
对时间序列进行平滑以描述其趋势的方法
可以用移动平均法和指数平滑法来对时间序列进行平滑以描述序列的趋势。
移动平均法是采用逐项递移的方法分别计算一系列移动的序时平均数,形成一个新的派生序时平均数时间序列,
指数平滑法通过对历史时间数列进行逐层平滑计算,从而消除随机因素的影响,识别现象基本变化趋势,并以此预测未来。
什么是指数
指数是描述报告期(或报告点)价格、数量或价值与基期(或基准点)相比的相对变化程度的指标。按计入指数项目数目的差异可将指数分为个体指数和综合指数。
个体指数:反映某一项目或变量变动的相对数。
综合指数:反映多个项目或变量综合变动的相对数。
什么是聚类分析及作用
聚类分析主要用于辨别具有相似性的事物,并根据彼此不同的特性加以聚类,使同一类事物具有高度的相似性,不同类的事物有较大的差异性,聚类分析能够从现有的样本数据出发,按照它们的亲疏程度分成若干类,并通过变量与变量的连接状况,揭示在同一类别中不同变量或样本的亲疏程度。
五种距离及定义
类间距离计算方法
最短距离连接法,最长距离连接法,类间平均距离连接法,类内平均距离连接法,重心聚类法等。
标准化处理方法
(1)标准分(Z Scores)
(2) -1 到 1 标准化(Range -1 to1)
(3)0 到 1 标准化(Range 0 to1)
(4)最大值为 1 的标准化(Maximum magnitude of1)
(5)均值标准化(Mean of 1)
(6)标准差标准化(Standard Deviation of 1)
因子分析的步骤
好像考(* ̄︶ ̄)
因子分析的基本步骤:
(1)根据具体问题,判断待分析的若干原始变量是否适合作因子分析,并采用某些检验方法来判断数据是否符合分析要求;
(2)选择提取公因子的方法,并按一定
标准确定提取公因子的数目;
(3)考察公因子的可解释性,并在必要时进行因子旋转,以寻求最佳的解释方式;
(4)计算出因子得分等中间指标,进一步分析使用
双因素方差分析表
超简单,而且必考(* ̄︶ ̄)恭喜你!
n = k*b
SSE = SST-SSR-SSC
测定季节变动的趋势-循环剔除法的基本思想和步骤
思想:消除趋势因素,再用平均的方法消除不规则变动
方法步骤:
(1)计算平均项数等于季节周期L的移动平均数,以消除季节变动S
(2)原数列各项数据除以移动平均序列对应时间的数据,得消除趋势和循环变动的序列
(3)将各年同月(或同季)的比率数据平均,以消除不规则变动I,在分别除以总平均数,即得季节变动比率S。
对季节比率的调整
比较两种公式编制出来的销售量指数和价格指数的差异
由上面计算得:拉氏指数大于帕氏指数,从实际资料看,当价格和销售量呈反方向变动的某段时间内,根据同一项资料计算的拉氏指数大于帕氏指数;反之某段时间内价格与销售量呈同方向变动,根据同一项资料计算的拉式指数小于帕氏指数
计算可决系数R^2,并解释它的含义
方差分析表:
总离差平方和:SST
回归平方和:SSR
残差平方和:SSE
多重样本决定系数 R^2:SSR/SST
R^2的取值范围在[0,1]之间,R ^ 2越趋近与1说明回归方差拟合的越好;R^2越趋近与0说明回归方差拟合的越差。
检验回归方程的线性关系是否显著
F检验用来检验回归方程线性关系是否显著,其假设为:H0:回归方程线性关系不显著;H1:回归方程线性关系显著
t检验用来检验回归系数的显著性,其假设为H0:B=0;H1:B!=0;
1,对多元回归方程的整体检验,就是看自变量x1…xn是从整体上对随机变量y有明显的影响,自变量与因变量的线性关系是否显著
2,具体方法,将回归离差平方和SSR与残差平方和SSE比较,应用F检验分析二者之间的差别是否显著,如果显著存在线性关系
(1)提出假设:
H0:B1=B2=…Bm=0(m:多少个因变量)
H1:至少有一个回归系数不等于0
如果不能拒绝原假设,说明回归模型对因变量没有显著的预测能力,拒绝原假设说明至少一个自变量能预测因变量y的显著性
(2)计算检验统计量F
F=(回归平方和SSR/自由度df) / (残差平方和SSE/(n-m-1))
(3)确定显著水平a和分子自由度m,分母自由度n-m-1,找出临界值Fa,a为显著水平
(4)作出决策:若F>Fa,拒绝H0(说明线性关系显著),若F<=Fa,接受H0。
检验各回归系数是否显著
(1)提出假设
H0:Bi=0(自变量xi与因变量无线性关系)
H1:Bi!=0(自变量xi与因变量y有线性关系)
如果不能拒绝 原假设,说明自变量xi不显著,如果拒绝原假设,说明xi能预测因变量y的显著性。
(2)计算检验的统计量t
t = bi - 0 / Sbi ~ t(n-m-1)
t = (系数/标准误差)
(3)确定显著水平a,并作出决策
abs(t) > t,拒绝H0说明自变量x1与因变量y有线性关系,abs(t) < t,不拒绝H0
标准误差:自变量x的偏回归系数的抽样分布的标准差
你完全不用计算,老师数全给你,真爽,这题必考(* ̄︶ ̄)
Sample Test
- 要了解某市工业企业生产设备情况,则统计总体是 该市工业企业的全部生产设备
- 若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大,则 甲单位的平均数代表性比较小
平均数的代表性可以用离散趋势来衡量。本题中已知标准差和平均数的关系,可采用最常用的离散系数,其越大,平均数的代表性就越小。公式为 v=s/x,由已知得Vσ甲>Vσ乙,即甲单位的平均数代表性比较小。
- 一个统计总体 可以有多个标志
标志反映总体单位的特征或属性的名称,故总体单位可以有多个标志;统计指标反映现象总体数量特征的基本概念和具体数值的总称,故总体可以有多个统计指标。
总体单位属于统计标志的直接承担者,属于载体;统计标志依附于总体单位并说明总体单位的属性和特征。依附于某个总体单位的标志可以有多个。
统计总体简称“总体”。统计所要研究的事物的全体,由许多具有某种共同属性或特征的个别事物组成。组成总体的个别事物称为总体单位。
统计标志简称标志,是指统计总体各单位所具有的共同特征的名称。
从不同角度考察,每个总体单位可以有许多特征.
总体单位是统计标志的直接承担者,是载体;统计标志依附于总体单位并说明总体单位的属性和特征。依附于某个总体单位的标志可以有多个。
分类:1、按变异情况,可分为不变标志和变异标志。2、按其性质,可以分为品质标志和数量标志。
- 品质标志的表现形式是 文字
1、品质标志:品质标志是说明总体单位的特征的,是不能用数值来表示的。
2、数量标志:数量标志是用绝对数形式表现的,用来反映总体单位规模大小、数量多少的统计指标,其数值大小一般随总体范围的大小而增减。
1、品质标志:按品质标志分组能直接反映事物间质的差别,给人以明确、具体的概念。
2、数量标志:反映总体规模大小、数量。
- 统计工作的各项任务归纳起来就是两条 调查统计和调查分析
- 对上海港等十多个沿海大港口进行调查,以了解全国的港口吞吐量情况,则这种调查方式是 重点调查
重点调查是在调查对象中选择一部分重点单位进行调查的方法。
它是一种非全面调查,既可用于经常性调查,也可用于一次性调查。
其特点是所选择的调查对象的标志值在所要研究的标志总量中或占很大比重或有较大代表性,能反映总体的基本状况。
例如,要想了解工业贷款的增长原因,只要选择变化较大的有代表性的重点企业进行调查就可以分析清楚。
- 某连续变量分为五组:第一组为40~50;第二组为50~60;第三组为60~70;第四组为70~80;第五组为80以上。依习惯上规定 70在第四组,80在第五组
- 某城市为了解决轻工业生产情况,要进行一次典型调查,在选送调查单位时,应选择生产情况(好、中、差)的企业。
典型调查选择的调查对象比抽样调查抽取的样本更具有代表性,但它也是通过从总体中选择个别对象进行调查研究从而推判总体的调查方法。相应地人们思维过程,也是从个别典型的认识到一般总体的认识,这符合人们认识客观事物从个别到一般的认识规律。同时,典型调查偏向从性质上分析调查对象,从总体特性认识调查对象,而几乎没有只对典型进行量的分析,却不进行质的判断的情况。这无疑是一种科学思维的方法。
-
该组的分组标志是 男、女(看行号)。
-
变量数列中各组频率的总和应该 =1。
-
在完成了构造与评价一个回归模型之后,我们可以 以给定自变量的值估计因变量的值。
-
回归直线方程 y = a+bx ,其中x为自变量,y为因变量,则 可以根据x推断y
-
设总体X服从正态分布N(u,a^2),未知 a^2。若样本容量n和置信度1-a均不变,则对于不同的样本观测值,总体均值μ的区间估计的精确度 不变
-
在假设检验中,原假设H0,备择假设H1,则称(H0不真,接收H0)为犯第二类错误。
第一类错误是原假设H0为真却被拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;第二类错误是原假设为伪却没有拒绝,犯这种错误的概率用β表示,所以也称β错误或取伪错误。
- 评价回归直线方程拟合优度如何的指标有 可决系数R2
评价回归直线方程拟合优度用判定系数r2或者标准误差,判定系数越高、标准误差越小则拟合程度越好。
- 欲以图形显示两变量X与Y的关系,最好创建 散点图
- 众数是 次数最多的变量值
- 在抽样调查中,无法避免的误差是 抽样误差
- 若两正态总体方差未知但相等,作均值等检验时应采用 T检验
- 所谓“上组限不在内”原则,是对连续型变量分组采用重合组限时,习惯上规定一般只包括本组下限变量值的单位,而当个体的变量值恰为组的上限时,不包括在本组。
- 当H1为真时拒绝H1,犯了“纳伪”错误。
- 假设检验范两类错误的概率不可以同时控制
- X、Y两个变量之间,既可由Y对X回归,也可由X对Y回归,于是可产生两个回归系数。× 不可以
- 按检验假设的形式,可以把假设检验分为左侧检验与右侧检验 × 不可以
- 抽取大小不同的公司属于定性变量
定性变量是统计学的概念,又名分类变量 ,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。
定量变量 也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。
区别:定性变量并非真有数量的变化,而只有性质上的差异。定量变量具有数值特征。
- 一个统计总体 可以有多个指标
标志是说明总体单位特征的名称;指标是反映总体现象数量特征的概念及其具体数值。一个统计总体特征多,就可以用多个指标来说明;反之,可以用少数指标来说明。
- 调查某大学2000名学生学习情况,则总体单位是 每一名学生
总体单位是构成总体的每一个别事物,根据研究目的的不同,总体单位可以是组织,也可以是人,还可以是事物或者事件等。
如:对工业企业进行调查,全国工业企业是总体,每一个工业企业就是单位。若研究目的不同,总体和总体单位可以互换,总体有可能变成总体单位,总体单位有可能变成总体。
- 某地进行国有商业企业经营情况调查,则调查对象是 该地所有国有商业企业
- 某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是 调查期限
- 用水平法检查长期计划完成程度,应规定 计划期末应达到的水平
- 时间序列中,每个指标数值可以相加的是 时期数列
时间序列按照其构成要素中统计指标值的表现形式,分为绝对数时间序列、相对数时间序列和平均数时间序列三种类型。
依据指标值的时间特点,绝对数时间序列又分为时期序列和时点序列。
时期序列中,每一指标值反映现象在一定时期内发展的结果,即“过程总量”,每个指标数值可以相加;
时点序列中,每一指标值反映现象在一定时点上的瞬间水平,其指标值不可以相加。
- 根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是 各期的二级增长量大体相等
- 红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为 95% / 96%。
- 某企业报告期产量比基期产量增长了10%,生产费用增长了8%,则其产品单位成本降低了多少 怎么做的?
其产品单位成本降低了1/55。
分析过程:设100个产品,生产费用100块。单位成本就是100÷100=1。产量增加10%就是110,费用增长8%,就是108。
单位成本就是108÷110=54/55。所以成本降低了1/55。
- 若某总体次数分布呈左偏分布,则成立的有 x_<Me<Mo
左偏均值小 众数>中位数>均值 Me:中位数
右偏 众数<中位数<均值
- 下列各项中属于品质标志的有 性别、职务、民族
- 影响抽样误差的因素有 是重复抽样还是不重复抽样 、总体标志变异程度大小
- 统计学的基本概念中 标志是说明总体单位特征的概念 、指标是说明总体特征的概念、可变的数量标志是变量
- 调查某市职工家庭的生活状况时,统计总体是 该市全部职工家庭
- 要了解上海市居民家庭的收支情况,最适合的调查方式是 抽样调查
- 众数不唯一,众数不受极端值影响,可能存在多个众数,众数通常适用于分类数据
- 若两组数列的计量单位不同,在比较两组数列离散程度大小时,宜采用 离散系数
- 某系在400名学生中开展抽样调查,共随机抽取100名学生,分别从四个年级中各随机抽取25名学生,这种抽样方式属于 分层抽样
1、简单随机抽样的方式是对全部样本进行随机抽取,每个样本被抽到的概率一样。
例如:1—100,从中随便抽取一个数,每个树被抽到概率一样,都是百分之一。
2、系统抽样就是把总体的元素编号排序后,再计算出某种间隔,然后按一固定抽取元素来组成样本的方法。适合用于总体及样本规模都较大的情况。它与简单随机抽样一样都要有完整的抽样框。比如在3000名学生中抽取100名,则先将这3000名的名单依次编上编号,再根据公式K(抽样间距)=N(总体规模)/n(样本规模)=3000/100=30,即每隔30名抽1名。
3、分层抽样是将全部样本分成一定比例的样本,进行抽取。
例如:1—100,将其每隔十个数分成一组,共十组,各组中每一个数的概率相同,都是十分之一。
- 抽样分布是指 样本统计量的分布
- 总体均值为 50 ,标准差为 8 ,从此总体中随机抽取容量为 64 的样本,则样本均值的抽样分布的均值和标准差分别为 50,1
n=64≥30,根据中心极限定理,当总体均值为μ,标准差为σ时,从该任意总体中抽取样本量为n的样本,n充分大时,样本均值的抽样分布的均值为:μ=50,标准差为
样本标准误=总体标准差/n开根号
标准差=标准误*根号N,
- 中心极限定理的理解 当样本容量充分大时,可以忽略总体形状
- 已知容量为100时,样本均值的标准差为30,为使标准差降为15,可将样本容量调整为 400
s1sqrt(n1) = s2sqrt(n2) s1=30,n1=100,s2=15,n2=?
- 离散系数 CV=标准差/均值
- 统计学的研究对象具有的特点是:
总体性、数量性、具体性、数据的随机性、数量的广泛性
50.组距与组数的关系是 反比例关系
组数:把数据分成若干个组,分组的个数即是组数。
组距:在一组数据中,最大值(组上限)与最小值(组下限)之间的距离。
组数与组距之间成反比关系。组数越多,则组距越小。反之,组数越小,则组距越大。
- 峰度是分布集中趋势高峰的形状,与正态分布相比分为尖峰分布和平峰分布
峰度是分布集中趋势高峰的形状指次数分布曲线顶端的陡峭程度
- 数量指标综合指数是编制数量指标指数的基本形式;通常是以基期质量指标作同度量因素;
- 质量指标综合指数是编制质量指标指数的基本形式;通常是以报告期数量指标作为同度量因素;
- 抽样推断是建立在随机抽样基础上的
- 点估计的评价准则:无偏性、有效性、一致性
- 研究者想收集证据予以支持的假设通常称为 备择假设
- 单因素方差分析进行多重比较的前提是拒绝原假设
- 当所有观察值y都落在回归直线上,则x与y之间的相关系数 r=1/-1
- 用原始资料平均法测定季节变动,适合于呈水平趋势的序列
管理统计学名词解释
…
相信我你一定不会挂科(* ̄︶ ̄)
以上是关于《管理统计学》期末备考(不挂科)的主要内容,如果未能解决你的问题,请参考以下文章