存储基础知识- 数据与信息

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了存储基础知识- 数据与信息相关的知识,希望对你有一定的参考价值。

一、数据,信息和知识
随便敲击键盘,就可以看到,搜索引擎上面已经就“数据”和“信息”分别给出了不同的定义,而且就这个两个概念自身而言,每个概念又有很多相近但是不完全相同的解释。具体到每个人的实际应用当中,“数据”和“信息”到底有什么区别呢?当关注一件事物的时候,到底是应该关注和它有关的数据还是信息呢?

1、数据和信息

一般来说,人们会认为“数据”的概念更客观一些,指的是那些能够不依赖人们主观意愿而转移、变化的现实存在。而信息则是对数据处理加工后的结果,人们会把对自身有价值的数据称之为信息。

比如对于一个足球迷而言,这个世界上一切有关足球的历史、记载;每一天发生的足球比赛、教练、球员以及工作人员的状况;甚至还有国际足联以及其下级单位的规定……这些都属于足球世界的数据。但是具体到这个球迷个体,他很有可能只关注自己喜爱的球队、球星……以及很有限的足球相关事件,这些他所关注的,就是信息。

现实一点来看,人们永远无法掌握“所有的数据”,却可以掌握可以让自己做出判断的“足够的信息”。

2、数据,信息,知识与管理

在大数据时代,数据,信息,知识都是常被提及的词语。DIKW金字塔(Data, Information, Knowledge, Wisdom)在80年代就被提出来了。然而,数据、信息、知识、智慧的关系到今天依然没有理清。撇开智慧不谈(大概是通用人工智能的层级),下面主要厘清一下数据、信息、知识的关系。
技术图片

今天,学术界和业界大谈数据管理,数据分析,信息管理,知识工程,知识管理。在业界,数据、信息、知识许多时候表示的是同一个意思;在学术界,学者们努力区分数据、信息、知识,然而尚未达成共识。虽然所有人都可以隐约感觉到这三个概念之中的区别。根据DAMA-BOK,数据,信息,知识的定义如下:

数据是以文本、数字、图形、图像、声音和视频等格式对事实进行表现。

信息是指有上下文的数据。上下文包括:
(1)数据元素和相关术语的业务含义;
(2)数据表达的格式;
(3)数据所处的时间范围;
(4)数据与特定用法的相关性。我们作为消费者不断解释数据,从而创造出信息。

知识是对情境的理解、意识、认识、识别,以及对其复杂性的把握。知识是基于某一角度的信息整合形成的一种观点。这种观点是基于对模式(例如由其他信息和经验形成的趋势)的承认和解释。知识还可能包括假设和有关推理的力量。知识可以是显示的,也可以是隐式的。当我们认识到信息的意义时,我们就获得了知识。

举个例子,网购中一个消费者购买了件1000元的商品。在市场部人员看来,1000元是数据,表示了购买金额的实事;消费者购买1000元这件事(包括时间、具体商品等)是信息,包含了1000元购买产生的上下文;而购买1000元的客户最终被归结为高价值客户,这是知识,包含了对情境的理解。我们发现,越高的层级就越抽象,层级的界限就越难厘清。我们不考虑哲学层面的区分(往往涉及到认识论),从企业实践角度关注数据,信息,知识之间的区别:

数据与信息的关键区别在于上下文情境;

信息与知识关键区别在于可操作性。

区分了数据、信息、知识后,有啥好处?厘清概念最大的好处在于作为讨论和交流的基础,和对事物分而治之的深入认识。在此基础上,我们可以理解企业之中的数据管理,信息管理和知识管理。

数据管理是信息管理和知识管理的基础。其要点在于,数据范围规定,数据质量维护,数据安全管理,数据系统构建。

信息管理帮助信息消费者解释数据。其要点在于,让人能够接触到有价值的上下文,增加信息的可得性,从而增强信息消费者的理解。

知识管理的要点在于可操作性。知识可以是显性的(在机器中)和隐性的(在人脑中)。在通用人工智能出现之前,不是所有隐性知识都能被转化为显性知识。因此,在人工智能时代,知识管理的要点在于,第一,尽可能将隐性知识转化为显性知识。例如,当前很多金融领域通过NLP技术,用机器对财报和新闻进行初步理解,将结果呈现给使用者,即是将从前需要人通过阅读完成的简单知识工作的自动化;第二,尽可能促进隐性知识的交流,即增强人与人之间的交流,例如AR技术可使学习者身临其境。

未来,企业将会越来越重视数据,信息,知识与其管理。

3、DIKW体系

DIKW体系是关于数据、信息、知识及智慧的体系,可以追溯至托马斯·斯特尔那斯·艾略特所写的诗--《岩石》。在首段,他写道:“我们在哪里丢失了知识中的智慧?又在哪里丢失了信息中的知识?”(Where is the wisdom we have lost in knowledge? / Where is the knowledge we have lost in information?)。1982年12月,美国教育家哈蓝·克利夫兰引用艾略特的这些诗句在其出版的《未来主义者》一书提出了“信息即资源”(Information as a Resource)的主张。其后,教育家米兰·瑟兰尼、管理思想家罗素·艾可夫进一步对此理论发扬光大,前者在1987年撰写了《管理支援系统:迈向整合知识管理》(Management Support Systems: Towards Integrated Knowledge Management ),后者在1989年撰写了《从数据到智慧》(“From Data to Wisdom”,Human Systems Management )。

DIKW体系将数据、信息、知识、智慧纳入到一种金字塔形的层次体系,每一层比下一层都赋予的一些特质。原始观察及量度获得了数据、分析数据间的关系获得了信息。在行动上应用信息产生了知识。智慧关心未来,它含有暗示及滞后影响的意味。

技术图片

数据是知识阶层中最底层也是最基础的一个概念。数据是形成信息,知识和智慧的源泉。

“信息”是当代使用频率很高的一个概念,由于很难给出基础科学层次上的信息定义.信息(Information)有一定含义的、经过加工处理的、对决策有价值的数据。

信息=数据+处理

信息必然来源于数据并高于数据。信息是具有时效性的有一定含义的,有逻辑的、经过加工处理的、对决策有价值的数据流。信息=数据+时间+处理。

知识是让从定量到定性的过程得以实现的、抽象的、逻辑的东西。知识是需要通过信息使用归纳、演绎得方法得到。知识就是知道了什么(Know-what)、知道为什么(Know-why)、知道怎么做(Know-how)、知道谁(Know-who)。知识之所以在数据与信息之上,是因为它更接近行动,它与决策相关。

有价值的信息沉淀并结构化后就形成了知识。

智慧(Wisdom):知识的选择(Selection)。

智慧是知识层次中的最高一级。它同时也是人类区别于其他生物的重要特征。我们经常看到一个人满腹经纶,拥有很多知识,但不通世故,被称做书呆子。也会看到有些人只读过很少的书,却能力超群,能够解决棘手的问题。我们会认为后者具有更多的智慧。

应对的行动方案可能有多种,但(战略)选择哪个靠智慧。智慧是人类基于已有的知识,针对物质世界运动过程中产生的问题根据获得的信息进行分析,对比,演绎找出解决方案的能力。

4、基于DIKW体系的企业数字化转型

随着人类社会从工业经济时代进入知识经济时代,知识管理的出现为21世纪知识经济时代的企业组织提供必须的管理基础。以彼得.德鲁克博士(Peter F. Drucker)和斯威比博士为代表提出的理论为知识管理领域的开拓和发展作出了杰出贡献。

德鲁克把过去200年的组织创新总结为三次革命:

第一次是工业革命,核心是机器取代了体力,技术超越了技能;

第二次是生产力革命,大致从1880年到第二次世界大战。核心是以泰勒制为代表的科学管理的普及。工作被知识化,强调的是标准化、可度量等概念,公司这种新组织随着科学管理思想的发展而兴起;

第三次是管理革命,知识成为超越资本和劳动力最重要的生产要素。和体力劳动者相比,知识工作者是否努力工作,很难被直接观察和测量,相应的管理的重心也从可度量的结果考核转向激励,特别是动机的匹配。期权激励是这20年高科技企业大发展最重要的组织创新。

沿着这个思路,我把我们正面临的时代大变革称之为第四次革命,创造力的革命。从互联网到移动互联网,再到物联网,从云计算到大数据,未来商业的一个基本特征已经非常清楚,那就是基于机器学习的人工智能,将成为未来商业的基础。

虽然对于人工智能的未来还有着很大的争议,特别是机器能否超越人脑,甚至是否会反人类。但一个基本的共识是,在可见的未来,机械性的、可重复的、可结构化的脑力劳动,甚至较为复杂的分析任务都会被机器智能所取代。

这是对德鲁克所说的知识经济的进一步发展,但同时人的直觉、对知识的综合升华能力,依然是机器暂时难以超越的。

毫无疑问,我们已经生活在知识经济和知识管理的环境当中。每时每刻,我们身边都充满了各种各样的数据。但只有将这些杂乱无章的数据,转换为信息和知识,才能帮助我们做出聪明的选择。知识管理 ( Knowledge Management, KM )是识别组织中的知识资产、并充分发挥知识资产的杠杆作用,来帮助企业获取竞争优势的过程。

从大的趋势来看,我们今天已经进入了一个产品过剩、消费升级的时代,企业间的市场竞争异常的残酷;以往,我们企业的一个产品推出,市场活动的开展,可能还可以依据经验,依据企业主的智慧来展开,但今天,我们必须要用数据说话,要用数据来进行决策,而这比如推动着数字化转型到来;而同时,企业的决策要依托数据来展开,也必须构建起自己的DIKW体系,并将这套体系模型变成软件里面的知识、算法、从而更好支撑企业做好预测,做好市场分析;

所以,企业数字化转型的大趋势,是企业面对市场竞争的需要,也是企业建立健康有效的决策链条的需要;而DIKW体系的构建,正是为企业走向这种健康有效的决策体系提供了参考和模型。

数字化的数据来自于实际生产过程中实时数据采集;而信息化的数据往往来自于人工输入或者表单的导入。
技术图片

为什么这么说了,用一个很简单例子就可以说明:

仓库管理系统WMS,对于商品的出入库管理,在信息化时代,往往是一个仓管员拿着出入库单,录入到仓库管理(WMS)系统内,来完成数据采集。

而数字化时代,应该是商品在出入库的时候,借助于产品包装上的二维码、RFID标签,通过扫码来进行识别,完成对出入库数据的采集。

这两者带来的差异,一是数据的实时性,二是数据的准确性;很明显,数字化依托于各种传感设备来实现实时的数据采集,摒弃了以往的很多数据不及时,不同步,以及人工录入的数据偏差,大大提升了效率。
技术图片

那么,为什么今天数字化转型变得热门,且变得这么急迫了呢,我想主要有这么几点:

1)以往的信息化系统,基于人工效率,基于采集难度,我们无法获取到更多的数据,我们只能采集关键数据;

2)传感器技术,造价也限制以往的数字化发展;

3)云计算、大数据时代的到来,让我们不仅仅可以关注关键节点数据,而是可以关注全程数据,继而从大数据中最大限度的挖掘数据价值;

4)通信技术的迅猛发展,特别是5G到来,让物联网,让万物互联不再成为难事,而且成本可控;

参考文献
https://www.optisolbusiness.com/insight/digital-transformation-cultural-or-technological
https://www.jianshu.com/p/fb7a866a471a
http://index.baidu.com/v2/main/index.html#/demand/%E6%95%B0%E5%AD%97%E5%8C%96%E8%BD%AC%E5%9E%8B?words=%E6%95%B0%E5%AD%97%E5%8C%96%E8%BD%AC%E5%9E%8B
https://www.jianshu.com/p/02096efb5658
https://blog.csdn.net/universsky2015/java/article/details/103813939

以上是关于存储基础知识- 数据与信息的主要内容,如果未能解决你的问题,请参考以下文章

Linux 基础知识

二、视频编解码基础知识

2017-2018-1 20155231 《信息安全系统设计基础》第9周学习总结

Linux入门基础知识

章节七:csv&excel

java算法与数据结构必备知识点汇总