大数据学习笔记:初探大数据世界

Posted howard2005

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据学习笔记:初探大数据世界相关的知识,希望对你有一定的参考价值。

文章目录


一、大数据时代

  • 进入2012年,大数据(Big Data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。
  • 数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。
  • 正如《纽约时报》2012年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。
  • 哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”

(一)第三次信息化浪潮

  • 根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革。

(二)信息科技支撑大数据时代

1、存储设备容量不断增加

2、CPU处理能力大幅提升

3、 网络带宽不断增加

(三)大数据时代来临

  • 数据产生方式的变革促成大数据时代的来临


(四)大数据发展历程

  • 大数据的发展经历了萌芽期、成熟期与大规模应用期

二、大数据概念

  • 目前,学界对于大数据的概念主要有以下三种认识:第一,从大数据“大”的特征进行界定,强调大数据是海量数据的集合;第二,对大数据进行综合、全面的界定,大数据不仅包括数据本身,还包括与大数据相关的技术、人才、制度等;第三,从大数据的价值出发,强调大数据的核心价值在于背后所蕴藏的规律,这一观点以“大数据之父”舍恩伯格为代表。大数据本身就是个开放的理念,上述对大数据概念的不同界定,反映了学者们对大数据认识的多元化,他们从个人的知识结构和研究旨趣出发,对大数据有着不同角度的解读。

(一)数据量大

  • 根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)
  • 人类在最近两年产生的数据量相当于之前产生的全部数据量
  • 预计到2020年,全球将总共拥有35ZB的数据量,相较于2010年,数据量将增长近30倍

(二)数据类型繁多

  • 大数据是由结构化和非结构化数据组成的
    – 10%的结构化数据,存储在数据库中
    – 90%的非结构化数据,它们与人类信息密切相关

(三)处理速度快

  • 从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少
  • 1秒定律:这一点也是和传统的数据挖掘技术有着本质的不同

(四)价值密度低

  • 价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒,但是具有很高的商业价值。

三、大数据的影响

  • 图灵奖获得者、著名数据库专家Jim Gray博士观察并总结人类自古以来,在科学研究上,先后历经了实验理论计算数据四种范式。

(一)在思维方式方面

  • 大数据完全颠覆了传统的思维方式
    – 全样而非抽样
    – 效率而非精确
    – 相关而非因果

(二)在社会发展方面

  • 大数据决策逐渐成为一种新的决策方式。大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。

(三)在就业市场方面

  • 大数据的兴起使得数据科学家成为热门职业

(四)在人才培养方面

  • 大数据的兴起,将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制

四、大数据的应用

  • 大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业都已经融入了大数据的印迹。
  • 典型的大数据应用实例

五、大数据关键技术


六、大数据计算模式

七、大数据产业

  • 大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合。

八、大数据与云计算、物联网的关系

  • 云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者相辅相成,既有联系又有区别。

(一)云计算

1、云计算概念

  • 云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。

  • 云计算服务模式与类型

2、云计算关键技术

  • 云计算关键技术包括:虚拟化、分布式存储、分布式计算、多租户等

3、云计算数据中心

  • 云计算数据中心是一整套复杂的设施,包括刀片服务器、宽带网络连接、环境控制设备、监控设备以及各种安全装置等
  • 数据中心是云计算的重要载体,为云计算提供计算、存储、带宽等各种硬件资源,为各种平台和应用提供运行支撑环境
  • 全国各地推进数据中心建设

4、云计算应用

  • 政务云上可以部署公共安全管理、容灾备份、城市管理、应急管理、智能交通、社会保障等应用,通过集约化建设、管理和运行,可以实现信息资源整合和政务资源共享,推动政务管理创新,加快向服务型政府转型
  • 教育云可以有效整合幼儿教育、中小学教育、高等教育以及继续教育等优质教育资源,逐步实现教育信息共享、教育资源共享及教育资源深度挖掘等目标
  • 中小企业云能够让企业以低廉的成本建立财务、供应链、客户关系等管理应用系统,大大降低企业信息化门槛,迅速提升企业信息化水平,增强企业市场竞争力
  • 医疗云可以推动医院与医院、医院与社区、医院与急救中心、医院与家庭之间的服务共享,并形成一套全新的医疗健康服务系统,从而有效地提高医疗保健的质量

5、云计算产业

  • 云计算产业作为战略性新兴产业,近些年得到了迅速发展,形成了成熟的产业链结构,产业涵盖硬件与设备制造、基础设施运营、软件与解决方案供应商、基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、终端设备、云安全、云计算交付/咨询/认证等环节。

(二)物联网

1、物联网概念

  • 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化和远程管理控制。

2、物联网关键技术

  • 物联网中的关键技术包括识别和感知技术(二维码、RFID、传感器
    等)、网络与通信技术、数据挖掘与融合技术等。

3、物联网应用

  • 物联网已经广泛应用于智能交通、智慧医疗、智能家居、环保监测、智能安防、智能物流、智能电网、智慧农业、智能工业等领域,对国民经济与社会发展起到了重要的推动作用。

4、物联网产业

  • 完整的物联网产业链主要包括核心感应器件提供商、感知层末端设备提供商、网络提供商、软件与行业解决方案提供商、系统集成商、运营及服务提供商等六大环节。

(三)大数据与云计算、物联网的关系

  • 云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者既有区别又有联系。

以上是关于大数据学习笔记:初探大数据世界的主要内容,如果未能解决你的问题,请参考以下文章

大数据讲课笔记2.1 初探大数据

大数据学习笔记59:初探Kafka消息系统

大数据技术在电子政务中的应用分析

大快政务大数据平台解决方案

大数据讲课笔记5.1 初探MapReduce

大快政务大数据分析平台架构与特点介绍