大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)
大数据技术可理解为在巨量的数据中提取到有用的部分加以分析和处理。例如,在某些电商中通过收集用户浏览或购买过的产品,向用户主动推荐用户感兴趣的产品。
大数据分析有五个方面:
1、可视化分析:可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。
2、数据挖掘算法:大数据分析的理论核心就是数据挖掘算法。
3、预测性分析:从大数据中挖掘出特点,通过科学的建立模型,从而预测未来的数据。
4、语义引擎:需要设计到有足够的人工智能以足以从数据中主动地提取信息。
5、数据质量和数据管理:能够保证分析结果的真实性。
云计算:
通过网络以自助服务的方式获得所需要的IT资源的模式。
它有三个关键点:
①获取路径:通过网络;
②获取方式:自助服务;
③获取对象:IT资源(包括不限于计算能力、存储能力、带宽、DNS等)。
NIST还定义了三种服务模式(SaaS\PaaS\IaaS)和四种实施模式(公有云、私有云、社区云和混合云)
“云计算”的五大特点:
大规模、分布式;虚拟化;高可用性和扩展性;按需服务,更加经济;安全。
总结(两者的关系):
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。
它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。