大数据图谱不仅仅只是一团乱如麻的LOGO,其实还隐藏着另一种玄机

Posted 分析世界讲方案

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据图谱不仅仅只是一团乱如麻的LOGO,其实还隐藏着另一种玄机相关的知识,希望对你有一定的参考价值。


说起大数据图谱(BIGDATA LANDSCAPE),不得不说这是一张费眼的“烂图”,因为这张图除了各种彩色斑点外似乎什么都看不出来,但或许正是因为这样才能让读者感到大数据的劲爆。


FIRSTMARK是一家风险投资公司,当然也专注于大数据方向的项目投资,图谱中的公司LOGO都和FIRSTMARK有一定关系,可以说从最近五年的经验看,大数据图谱是在不断变化的,而且LOGO越来越多、越来越密。我有时在给客户讲大数据方案时,如果引入了这张图,那么真的要拿捏好适用场合,否则不知道是想说大数据选择丰富还是“无所适从”。


我们的客户在开展大数据项目前,一定知道要朝哪个方向发力。这就会给自己做个定位,比如要做大数据的提供者?大数据能力的建设者?大数据资源的使用者等等。这样就会进一步确定采用什么设计方案,引入什么类型的产品和工具,做哪个领域/哪个方向的研究……类似这样的需求,客户就可以参考Landscape里的logo,找到相应的企业提供支持和帮助。在这张图中,有领先的咨询公司,也有优秀的实施公司;有成熟的老牌企业,也有新兴的创业公司;有大数据开源组织,也有大数据商用产品……可以说只有你想不到的,没有这张图看不到的。


但终归,排版这张图的公司是一家投资公司,如果只是夸张作秀那我们也只能看看而已。所以我认为:大数据Landscape的精华一定不仅于此,我们需要深刻洞察并找到蛛丝马迹,从而指引企业构建大数据能力平台、开展大数据产品和业务支撑、服务于某个领域的具体细分市场,这才真的是学以致用。


我们将BIG DATA LANDSCAPE加以翻译、说明,自底向上分别剖析。

首先最底部是数据源,主要包括结构化、非结构化及半结构化数据。

高科技可穿戴设备的时期必然会采集到客户的健康情况,而且还有物联网数据、金融经济数据、航空/太空/海洋数据,总之有关于数据的一切都是大数据所关注的对象。


数据源的上层,是开源技术生态圈及相关工具集。

这里面涉及到开源技术框架、大数据存储及访问工具、数据查询引擎、在线处理引擎、分布式协调器等等。需要说明的是这些组件全部为开源社区的免费版,可以任意使用。


而在这张图的顶部包括了基础架构类、分析类和企业应用三部分。

基础架构主要是指在大数据领域中关注与底层架构的企业,底层架构决定了平台基础,也是大数据平台中非常重要的环节。需要说明的,大数据底层架构并非全是Hadoop,也并非仅是数据库。在这里面我们看到了图数据库、云数据仓库等行业热词,也包括数据治理、众包能力的构建。


分析域则是大数据的主要研究对象,也是业务价值产出的重要手段。不论是数据分析平台、还是数据科学/AI,数据可视化等等,每一个方向延展都可以归拢于某个大的分析专题。在这个领域中,主要涉及到企业应用领域的分析能力,有关于分析架构、分析平台的能力则主要归属于刚才介绍的基础架构域。


最后就是企业应用。所涉及到相关领域、各个行业、组织职能关系等关键词。从销售、市场、客户服务等前端领域,到人力、法律、财务等后勤管理,相应都有公司在辅佐这些行业的大数据业务研究。


所以我们看,一张大数据图谱(BIG DATA LANDSCAPE)不仅仅是公司LOGO在这个领域的能力支撑,更重要的是体现了大数据生态的构建关系。对于支撑客户开展大数据项目而言,具有下述重要意义:


1:开源软件引领大数据技术发展,引入开源框架可以提高产品开发效率;

2:积极归纳并总结业界标杆企业的领先经验,参考其架构、产品和工具集的能力,构建起自己的支撑平台;

3:充分借鉴成熟商业软件的产品优势,取长补短完善大数据平台生态;

4:结合自身业务发展,在新大数据产品、新技术方面有敏锐的洞察力,引领技术创新。

以上是关于大数据图谱不仅仅只是一团乱如麻的LOGO,其实还隐藏着另一种玄机的主要内容,如果未能解决你的问题,请参考以下文章

TCP 以及网络难题

你的房间总是一团乱吗?

JavaScript一团乱,这是好事

设计模式总结

大数据时代下的社交图谱与兴趣图谱

再见孙悟空