数据冗余的定义和几大分类

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据冗余的定义和几大分类相关的知识,希望对你有一定的参考价值。

数据冗余的含义和用途

把视频和音频信号数字化了之后,数据量大的惊人,因此,若存储大量的图像和音频信息需要大大提高系统的存储容量,通常解决的方法是采用大容量磁盘或光盘,但这仅仅是解决海量存储的一个办法,而数据冗余的作用就是将额外的数据或数据信息保存在一个独立的硬盘上,来防止数据丢失,下面详解什么是数据冗余?有哪些类型?

数据与信息虽然经常在一起使用,但概念是不相同的,数据是用来记录和传送信息的,数据是信息的载体。真正有用的不是数据本身,而是数据所携带的信息,信息量与数据量的关系可由下式给出:I=D-du(I,D,du分别为信息量、数据量与冗余量.冗余量du是指D中的数据冗余。)

冗余,指重复配置系统的一些部件,当系统发生故障时,冗余配置的部件介入并承担故障部件的工作,由此减少系统的故障时间。冗余网卡技术原为大型机及中型机上的技术,现在也逐渐被PC服务器所拥有。Redundant,自动备援,即当某一设备发生损坏时,它可以自动作为后备式设备替代该设备。

数据冗余是指数据之间的重复,也可以说是同一数据存储在不同数据文件中的现象,可以说增加数据的独立性和减少数据冗余是企业范围信息资源管理和大规模信息系统获得成功的前提条件,所谓的数据冗余是指数据库的数据中有重复信息的存在,这自然浪费了很多的存储空间,尤其是存储海量数据的时候,数据冗余是指同一数据被反复存放.这样着某一属性值发生改变,其他与之相同的属性值也要改变.数据冗余不仅增加了更新代价,更严重的是其潜在的数据不一致及存贮空间浪费等问题。

在数据库中存贮这类导出数据项需占用较多的存贮空间亦称为数据冗余.存贮冗余数据不仅代价高也是产生数据不一致的根源,数据冗余或者信息冗余是生产、生活所必然存在的行为,没有好与不好的总体倾向。

数据冗余的类型有哪些

一般而言图像、视频、音频数据中存在的数据冗余类型主要有以下一些:

(1)结构冗余:有些图像从大体上看存在着非常强的纹理结构,例如草席图像,我们称之为它在结构上存在冗余。

(2)信息熵冗余:又可称为编码冗余,是指一组数据携带的平均信息量。正因为多媒体数据中存在着上述的各种各样的冗余,所以多媒体数据是可以被压缩的。针对不同的冗余,人们已经提出各种各样的方法实施对于多媒体数据的压缩。

(3)时间冗余:这是序列图像(电视图像、运动图像)和语音数据中所经常包含的冗余。在电视、动画图像中,在相邻帧之间往往包含了相同的背景,只不过运动物体的位置略又变换。因此对于序列图像中的相邻两帧仅记录它们之间的差异,去掉其中重复的,称为时间冗余的那部分信息。同样,由于人在说话时产生的音频也是连续和渐变的,因此声音信息中也会存在时间冗余。

(4)空间冗余:图像数据中所经常出现的一种冗余。在同一幅图像中,规则物体和规则背景(所谓规则是指表面是有序的而不是完全杂乱无章的排列)的表面物理特性具有相关性,数字化图像中表现为数据冗余。例如一幅静态图像中的一大片蓝天、草地,其中每个像素的数据完全相同,如果逐点存储,就会产生所谓的空间冗余。完全一样的数据当然可以压缩,十分接近的数据也可以压缩,因为被压缩的数据恢复后人眼也分辨不出与原来的图片有什么区别,这种压缩就是对空间冗余的压缩。

(5)知识冗余:有许多图像的理解与某些基础知识有相当大的相关性。例如:人脸的图像有固定的结构。比如说嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于脸的中线上等等。这类规律性的结构可由先验知识和背景知识得到,称之为知识冗余。⑤视觉冗余:是由于人体器官的不敏感性造成的。例如在高亮度下,人的视觉灵敏度下降,对灰度值的表示就可以粗糙一些。对于太强太弱的声音,如果超出了“阈值”,人们听觉感受也会被掩蔽。利用感官上的这些特性,也可以压缩掉部分数据而不被人们感知(觉察)。

ps:硬盘、U盘、光盘、SD卡等存储设备的数据发生了丢失,使用迷你兔数据恢复软件进行恢复找回,它具有“删除恢复”、“格式化恢复”、“硬盘恢复”、“深度恢复”、“移动存储设备恢复”五大功能模块,恢复效率高,安全性有保障。

以上是关于数据冗余的定义和几大分类的主要内容,如果未能解决你的问题,请参考以下文章

从分类数据集中删除冗余特征( make_classification )

音频视频编码知识

空间冗余

数据库的冗余字段

训练模型 - 不同角度的冗余图片

高光谱遥感图像相关知识梳理大全