学习笔记高等数据基础
Posted SAP剑客
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学习笔记高等数据基础相关的知识,希望对你有一定的参考价值。
一、数学概况
二、数据类型
【分类1】
离散型数据 : 比如骰子,无论怎么掷,概率都是1/6。
离散随机变量是指一个只取有限个数或可数无限个数值的随机变量。
通常用古典概型来描述。
连续型数据 :比如 时间/长度/面积 ,概览都是1/∞=0。
连续随机变量是指一个取任何实数的概率都为零的变量。
通常用几何概型来描述。
【分类2】
横截面数据:某个时间点/时间段内取到的数据,比如商业领域数据,是处理方法最全面最完善的数据。有各种各样的模型来处理横截面数据,比如回归模型,神经网络,决策树等。
时间序列数据:比如金融领域数据,例如股票,随着时间的改变,股票的市值呈现折线图,其自带因果性,过去的数据或多或少会影响未来。
面板数据:既有时间属性又有空间属性,比如去年一年所有省市自治区的销售数据,该类企业很少处理使用。
【分类3】
定类尺度:比如国籍/男女,不可排序,不可运算,因为中国不可能大于美国,中国也不可以加减美国。
定序尺度:比如健康状况,可以排序,不可运算,比如健康可依次分为优良差,但不可以优加减良。
定距尺度:数值型数据,可以排序,可以运算,比如年份,0点是有意义的,公元零年。
定比尺度:数值型数据,可以排序,可以运算,比如体重,0点是没有意义的,0体重不存在。
最后,注意不同类型数据要用不同数据类型去处理。
以上是关于学习笔记高等数据基础的主要内容,如果未能解决你的问题,请参考以下文章