请高手详细解释一下
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了请高手详细解释一下相关的知识,希望对你有一定的参考价值。
常听人说,我们熟知的那些音频,视频以及图形,图象的文件都是经过压缩处理之后的形式才存储在计算机中的,那么这"压缩"的过程就其本质,是对这些文件进行了一个什么样的处理,请详细说明一下!
首先,传输数字图像所需的带宽远窄于未压缩图像。例如,ntsc图像以大约640 x 480的分辨率,24bits/象素,每秒30帧的质量传输时,其数据率达28m字节/秒或221m位/秒。此外,ntsc声音信号还要使未压缩图像的比特率再增加一些。然而单速cd-rom(1x)驱动器只能以1.2m位/秒的速率传输数据。第二个原因是以28m字节/秒的速率,15秒的未压缩图像将占用420m字节的内存空间,这对于大多数只能处理小图像片断的台式计算机来说都是不可接受的。
当今把图像加入电子信号的关键问题是压缩方式。有几种不同的压缩方式,但mpeg是最有市场潜力的压缩方式
mpeg的历史和优点
mpeg(即moving picture experts group运动图像专家小组)是个国际标准,即所谓iso11172。它的两个标准—mpeg-1和mpeg-2特别重要。mpeg-1于 1991年引入,用于加速cd-rom中图像的传输。它的目的是把221mbit/秒的ntsc图像压缩到1.2mbit/秒,压缩率为200:1。这是图像压缩的工业认可标准。
mpeg-2用于宽带传输的图像,图像质量达到电视广播甚至hdtv的标准。和mpeg-1相比,mpeg-2支持更广的分辨率和比特率范围,将成为数字图像盘(dvd)和数字广播电视的压缩方式。这些市场将和计算机市场交织在一起,从而使mpeg-2成为计算机的一种重要的图像压缩标准。这一点非常重要,因为将mpeg-1的比特流解压缩时需要用到mpeg-2的解压缩器。另一标准——mpeg-4——正在发展中,它将支持非常低的比特率的数据流的应用,如电视电话,视频邮件和电子报刊等。
对mpeg的广泛接受意味着对它的使用者的投资保护。许多零售商出售mpeg的软件或硬件播放器,这种竞争造成了价格的下降和质量的上升。mpeg-1可以和mpeg-2兼容,因此它是一种尚有发展余地的标准。
MPEG视频压缩算法的基本原理
一般说来,在帧内以及帧与帧之间,众多的视频序列均包含很 大的统计冗余度和主观冗余度。视频源码的最终目标是:通过挖掘 统计冗余度和主观冗余度,来降低存储和传送视频信息所需的比特 率;并采用嫡编码技术,以便编制出“最小信息组”一个实用的 编码方案,是在编码特性(具有足够质量的高压缩)与实施复杂性 之间的一种折衷。对于MPEG压缩算法的开发来讲,计及到这些标 准的寿命周期应考虑到现代超大规模集成电路技术的能力,这一点 是最重要的。 根据应用的要求,我们也许会想到视频数据的“无损失”编码 和“有损失”编码“无损失”编码的目的在于:在保持原图像质 量(即解码后的图像质量等同于编码前的图像质量)情况下,来减 少需要存储和传送的图像或视频数据。与此相反,“有损失”编码 技术(该技术跟MPEG—l和MPEG2视频标准未来的应用有关) 的目的是,去符合给定的存储和传送比特串。重要的一些应用包 括;利用限定的带宽或很窄的带宽,通过通信频道采传送视频信 息;有效地存储视频信息。在这些应用中,高的视频压缩是以降低 视频质量的办法来实施的,即跟编码以前的原始图像相比,解码后 的图像“客观”质量有所降低(也就是取原始图像和再现图像之间 的均方差,作为评定客观图像质量的标准)频道的目标比特率越低;那么视频所必须进行的压缩率就越大,通常可察觉的编码人工 产物也越多。有损失编码技术的最终目的是:在指定的目标比特串 条件下,获取最佳的图像标准。这里应服从“客观”或“主观”上 的最佳标准。这里应该指出,图像的降级程度(指客观降低以及可 察觉到的人工产物的数量)取决于压缩技术的复杂性——对于结构 简单的画面和视频活动少的图像来讲,就是采用简单的压缩技术, 也许能获得根本不带可察觉人工产物的良好的再现图像
(A)MPEG视频编码器源模式
MPEG数字视频编码技术实质上是一种统计方法。在时间和空 间方向上,视频列通常包含统计冗余度。MPEG压缩技术所依赖的 基本统计特性为像素之间(interpel)的相关性,这里包含这样一个 设想:即在各连续帧之间存在简单的相关性平移运动。这里假定: 一个特殊画面上的像素量值,可以(采用帧内编码技术)根据同帧 附近像素来加以预测,或者可以(采用帧间技术)根据附件帧中的 像素来加以预测。直觉告诉我们:在某些场合,如一个视频序列镜 头变化时,各附近帧中像素之间的时间相关性就很小,甚至消失 —这时,该视频镜头就成为一组无相关牲的静止画面的组合。在 这种情况下,可采用帧内编码技术来开发空间相关性,来实现有效 的数据压缩,MPEG压缩算法采用离散余弦变换(DCT)编码技 术,以8×8像素的画面块为单位,有效地开发同一面面各附近像 索之间的空间相关性。然而,若附近帧中各像素间具有较大的相关 性时,也就是说两个连续帧的内容很相似或相同时,就可以采用应 用时间预测(帧间的运动补偿预测)的帧间DPCM编码技术。在多 种MPEG视频编码方案中,若将时间运动补偿预测路剩余空间信息 的变换码自适应地结合起来,就能实现数据的高压缩(视频的 DPCM/DCT混合编码) 图1给出了一个画面的帕内像素问相关性特性的举例,这里采 用了一个非常简单,但很有价值的统计模式。这个假设的简单模式已包括了许多“典型”画面的一些基本的相关特性,也就是指相邻 像素间的高度相关性,以及随着像素间距的增大相关性的单值衰减 特性。我们以后将利用这一模式来展示变换区域编码的一些特性。 图1一些“典型”画面的像素间的空间相关性,是应用具有 高度像素间相关性的AR(1)GaussMarkov画面模式来加以计算 的。变量X和Y分别表示像素之间在画面水平和垂直方向上的距 离
(B)二次取样和内插法
几乎所有本论文中所叙述的视频编码技术,在编码之前,均大 量地进行了二次取样和量化工序。二次取样的基本概念是想减少输 入视频的Dimension 水平Dimension和或垂直Dimension),并在进 行编码处理之前先对像素进行编号。值得注意的是:在有些应用场 合,在时间方向上也对视频进行二次取样,以便在编码之前降低帧 频。在接收机端,已解码图像是通过内插法来加以显示的。这一方 法可以认为是一种最简单的压缩技术,这种压缩技术利用了人眼特 有的生理特姓,因而去除了视频数据中的含有的主观冗余度—即 与色度信号的变化相比,人眼对亮度信号的变化更灵敏。故众多 MPEG编码方案首先将画面分成YUV与量信号(一个亮度分量和 二个色度分量)接着,相对于亮度分量,对色度分量进行二次取 样,对于一些特殊应用,有一个Y:U:V比率(即对于MPEG—2 标准,采用4:1:1或4:2:2.
(C)运动补偿预测
运动补偿预测是一个有力的工具,以便减小帧间的时间冗余 度;并作为用于时间DPCM编码的预测技术,这一工具在MPEGl 和MPEG2视频编码标准中得到广泛应用。运动补偿概念是以对视 频帧间运动的估算为基础的,也就是说,若视频镜头中所有物体均在空间上有一位移,那么用有限的运动参数(如对于像素的平移运 动,可用运动矢量来描述)来对帧间的运动加以描述。在这一简单 例子中,一个来自前编码帧的运动补偿预测像素,就能给出一个有 效像素的最佳预测。通常,预测误差和运动矢量均传送至接收机。 然而,将一个运动信息对每一个编码画面像素进行编码,这既不值 得也没有这个必要。由于一些运动矢量之间的空间相关性通常较 高,有时可以这样认为:一个运动矢量代表一个相邻像素块的运 动。为了做到这一点,画面一般划分成一些不连接的像素块(在 MPEGl和MPEG2标准中一个像素块为16×16像素),对于每一个 这样的像素块,只对一个运动矢量进行估算、编码和传送(图2)。 在MPEG压缩算法中,运动补偿预测技术用来减少帧间的时间 冗余度,只对预测误差画面(原始画面与运动补偿预测画面之间的 差别)加以编码。总的来说,由于采用依据于前编码帧的预测,与 图l中所示的帧内相关性相比较,待编码的运动补偿帧间误差图像 中像素之间的相关性就差了。 图2用于运动补偿的块匹配法:在待编码的第N有效帧中,为 每一个画面块估算一个运动矢量(mv)该运动矢量针对前已编码 的第N—l帧中同样大小的一个参照画面块。运动补偿预测误差是 这样计算的:在带有前帧参照块中运动飘移对应物的面面块中,减 去一个像素。
(D)变换或编码
二十年来,人们已对变换编码进行了大量的研究,它已成为用 于静止画面编码和视频编码的一种非常流行的压缩方法。变换编码 的目的在于去掉帧内或帧间误差图像内容的相关性,对变换系数进 行编码,不是对画面的原始像素进行编码。为此,输入画面被分成 不连接的b像素的画面块(即N×N像素)。以一个线性、可分离的 和单元前向变换为基础,本变换可表示为一个矩阵操作,采用一个N×N变换矩阵A,采获取N×N变换系数C。 C=AbAt 这里AT表示变换矩阵A的一种移项式。注意:这种变换是可逆的, 原因是,采用线性和可分离的反向变换,可以再现原始的N×N个 b像素的画面块. b=AtCa 利用许多可能的方法,应用于较小的由8×8像素组成的画面 块的离散余弦变换(DCT)已成为一种最佳的变换,用于静止画面 和视频编码。事实上,由于基于DCT的方法具有较高的抗相关性 能,并能获得快速DCT算法,适用于实时应用,已在大多数画面 和视频编码标准中加以使用。VLSI技术的运行速率适合较广泛的 视频应用范围,故已商业化。 变换编码的主要目的是使尽量多的变换系数足够的小,使它仍 无效(从统计和主观测量角度来看)。同时,应尽量减小系数之间 的统计相关性,目的在于减少对剩余系数进行编码所需的比特数 量。 图3示出了帧内DCT系数8×8像素块的方差(能量),这里是 以图1中已讨论过的简单的统计模式设想为基础的。此处,每一个 系数的方差,表示了系数(大量帧的乎均值)的可变性。与方差大 的系数相比,方差小的系数在画面像素块再现时意义就不大了。如 图3中所示,一般来说,为了获得画面像素块的有用的近似再现, 只要将少量DCT系数传送给接收机就行。然而,那些最高有效位 DCT系数集中在左上角(低DCT系数),面随着距离的增加,系数 的有效牲就逐步下降。这意味着:与较低位的系数相比,较高位的 DCT系数在画面像素块再现时的重要性就差一些。采用运动补偿预测,DCT变换的结果是,使DCT定义域中的时间DPCM信号实现 筒单的再现—这实质上继承了这种相似的统计相关性,如以DCT 定义域中的这个DPCM信号来再现图2中的帧内信号(虽然能量有 所减少)—这就是为什么为了使帧间压缩获得成功MPEG算法要采用DCT编码的原因 图3图示了DCT系数的方差分布情况,典型地计算了大量的画 面块而获得的平均值。DCT系数方差计算是以图1中的统计模式为 基础的。U和V分别该8×8块中水平和垂直画面变换域变量。大 多数总方差集中在DCDC了系数周围(U=0,v=0) DCT跟离散傅里叶变换很接近,而认识到以下这点是重要的, 即可以对DCT系数加以频率说明,使其更接近于DFTo在画面块 内,低位的Dcr系数与较低的空间频率有关而高位的DCT系数 与较高的频率有关。这一特性在MPEG编码方案中被加以应用,以 便去除画面数据中所包含的主观冗余度,这一切是以人类视觉系统 标准为基础的。由于跟较高空间频率有关的再现误差比较,观众对 较低空间频率的再现误差更加敏感,故在给定比特率情况后,为了 要改进解码画面的视觉质量往往根据视觉(感觉量化)对系数进 行频率自适应加权(量化) 上述两种技术—时间运动补偿预测和变换域编码—的结 合,被认为是MPEG编码标准的关键点 MPEG算法的第三个特 点是这两种技术的处理是较小的画面块(典型情况是:在16×16 像素上进行运动补偿,在8×8像素上进行DCT编码)。由于这个原 因,MPEG编码算法通常又叫作基于画面块的DPCM/DCT混合算法.
MPEG-1:一个通用标准-一个应用于数字存储媒体
(最高速率达1.5Mb/s)的活动图像和伴音的编码标准
由MPEG—1开发出来的视频压缩技术的应用范围很广,包 括从CD—ROM上的交互系统,到电信网络上的视频传送 MPEG1视频编码标准被认为是一个通用标准。为了支持多种应用, 可有用户来规定多种多样的输人参数,包括灵活的图像尺寸和帧 频。MPEG推荐了一组系统规定的参数:每一个MPEG—l兼容解码器至少必须能够支持视频源参数,最佳可达电视标准:包括每行 最小应有720个像素,每个图像起码应有576行,每秒最少不低于 30帧,及最低比特率为1.86Mb/s,标准视频输入应包括非隔行扫 描视频图像格式。应该指出:但并不是说,MPEGl的应用就限制 于这一系统规定的参数组。 根据JPiG和H。261活动,已开发出MPEG—l视频算法。当 时的想法是:尽量保持与CCITT H.261标准的共同性,这样,支 持两个标准的做法就似乎可能。当然,MPEGl主要目标在于多媒 体CD—ROM的应用,这里需要由编码器和解码器支持的附加函数 牲。由MPEGl提供的重要特性包括:基于帧的视频随机存取,通 过压缩比特流的快进/快退搜索,视频的反向重放,及压缩比特流 的编辑能力。
(A)基本的MPEG—1帧间编码方案
基本MPEGl(及MPEG2)视频压缩技术的基础为:宏模块结 构、运动补偿及宏模块的有条件再补给。如图49所示,MPEG—1 编码算法以帧内编码模式(I图像)对视频序列的第一帧进行编码。 每一个下一帧采用帧间预测法(P图像)进行编码——仅仅采用来 自前面最近的已编码I或P帧的数据,来进行预测,MPEG—l算 法对基于画面块视频序列的帧加以处理。视频序列中的每一个彩色 输入帧被分割成多个非重迭的“宏模块”,如图4b所示。每一个宏 模块包含4个亮度块(Y1,Y2,Y3,Y4)及两个色度块(U,V), 每个宏模块的尺寸为8*8像素,这些数据块来自于亮度带和共址 的色度带。在Y:U:V亮度与色度像素之间的取样比为4:1:1 以最近的前帧为基础,采用运动补偿预测法来对P图像加以编 码。每一帧被分割成不连接的“宏模块”(MB)。 图4b对于每一个宏模块,对有关4个亮度块(Y 3,Y2,Y3, Y4)和两个彩色决(U,V)的信总均加以编码。每个包含8×8个 像素。 基本的混合型DPCM/DCT MPEGl编码器和解码器结构的方 块图示于图5之中。视频序列第1帧(I图像)以帧内(INTRA) 模式加以编码不参照任何一个过去帧或未来帧。在编码器处,DCT 被加到每一个8×8亮度块和色度块上,在DC了输出之后,该64个 DCT系数中的每一个系数被均匀量化(Q),在宏模块中被用来对 DCT系数进行量化的量化器步长,传送给接收机。‘量化之后,最低 位DO系数(DC系数)的处理方法跟保留(remaining)系数 (AC系数)的处理方法是不一样的,DC系数表示分量模块的平均 亮度,可用微分DC预测法对DC系数加以编码。保留DCT系数及 它们位置的非零量化器值被Z字形扫描,并采用可变长度编码 (VLC)表对其进行扫描宽度嫡编码。 图5一个基本混合型DC了/DPCM 编码器和解码器结构的方决图 图6中表示出了系数Z字形扫描的概念。因为要利用系数将这 个两维的画面信号变换成一个单维的比特流,故在量化DCT域二 维信号扫描之后,进行的是可变长度码—字分配工序。并沿着扫描 行和两个连续非零系数之间的距离(行程),对这些非零AC系数量 化器值(长度)加以检测。采用仅传送—个VLC码字的方法,对 每一个连续(行程、长度)对进行编码,Z字形扫描的目的在于: 在跟踪高频系数之前先去跟踪低频DCT系数(包含最大的能量) 图6在8×8块内,已量化DCT系数的Z字形扫描。仅仅对非 零量化DCT系数加以编码。图中指出了非零DCT系数可能的位置 Z字形扫描的做法要想做到按系数的有效性去跟踪DCT系数 参看图3,最低位的DCT系数(0,0)包含了这些决中的最大部分 的能量,这些能量集中在较低位的DCT系数周围 解码器执行反向操作,首先从比特流中提取可变长度编码字 (VLD)并加以解码,以便为每一个画面块获取非零DCT系数的位 置和量化器值。随着一个画面块所有非零DCT系数的再现(Q) 及随后获得的反DCT(DCT—1),就得到量化块像素值。通过对整 个比特流的处理,就对所有的画面块进行了解码,并加以了再现。 为了对P图像进行编码,前面的I图像的第N—l帧,存储在 设置在编码器和解码器内的帧存储器中。在宏模块中执行运动补偿 (MC)—对于即将进行编码的那个宏模块,在第N帧与第N—1 帧之间,仅对一个运动矢量进行估算。这些运动矢量被编码及传送 至接收机。运动补偿预测误差是这样计算的:即在带有前帧运动飘 移对应物的宏模块中减去一个像素。然后是将8×8DCT加入到包 含在该宏模块内的每一个8×8块中,接着是对DCT系数进行量化 (Q),并进行扫描宽度编码和炳编码(VLC)o这里需用一个视频缓 冲器;以确保编码器能产生一个常量的目标比特率输出。对于帧内 每一个宏模块来讲,量化步进(SZ)是可以调整的,以便获得给定 的目标比特率,并避免缓冲器出现溢流和下溢现象。 解码器采用反向处理,以便在接收机中再生第N帧的一个宏模 块。对包含在视频解码器缓冲器(VB)中的可变长度字(VLD) 进行解码之后,就能再现(Q和DCT—1操作)预测误差像素值。 来自包含在帧存储器(FS)中的前第N—1曲的运动补偿像素,被 加入到预测误差之中,以恢复第N帧的那一宏模块。 在图7a一图7d中9采用了一个典型的测试序列,描述了采用 运动补偿预测编码视频的好处,而该预测是以MPEG编码器中的前 第N—1再现帧为依据的。用7a示出在N时间上将要进行编码的一 个帧,图7b示出了在N—1时间上的再现帧,其存储在设置在编码器和解码器中的帧存储器(FS)内。采用编码器运动估算方法已对 图7b中所示的块运动矢量(mv,参照图2)加以估算,并能预测第 N帧中每个宏模块的平移运动的位移(参照第N—1帧)。图7b出 示了这个纯帧差信号(第N帧减去第N—1帧),若在编码过程根本 不采用运动补偿预测,那么就能获得这个帧差信号——即假定所有 运动矢量为零。图7d出示了:当采用图7b的运动矢量来进行预测 时的运动补偿帧差信号。很明显,跟图7c中的纯帧差编码相比,采 用运动补偿,大大减缩了这个将要被编码的残差信号。 图7:(a)在N时间上将要被编码的帧:(b)在P4—1时间上 的帧,用来预测第N帧的内容(注意:四面中所示的运动矢量,并 不是存储在编码器和解码器内的再现画面的一部分;(c)没采用运 动补偿所获取的预测误差画面——假设所有的运动矢量均为零; (d)若采用运动补偿预测,将要进行编码的预测误差画面.
mpeg如何工作
mpeg-1的特点是它是一种有损的,非平衡编码。有损意味着为达到低比特率,一些图像和伴音信息将丢失。通常这些信息是人眼和人耳最不敏感的信息,因此即使以1x cd-rom的速率压缩也能达到vhs的图像质量和高保真立体声的效果。mpeg采用非平衡编码意味着压缩一幅图像比解压缩慢的多。
mpeg-1的数据流包含3种成分:图像流,伴音流和系统流。图像流仅仅包含画面信息,伴音流包含声音信息,系统流实现图像和伴音的同步。所有播放mpeg图像和伴音数据所需的时钟信息都包含在系统流中。
mpeg用复杂的数学和心理学技术达到它的压缩结果。mpeg伴音压缩编码利用了人耳灵敏度的研究结果,图像编码利用人眼对亮度,颜色,运动的灵敏度的一些有利结果。
mpeg伴音
cd伴音两个通道共包含1.4mbit/秒的数据流。听觉心理学研究表明,采用适当的压缩技术,此数据流可以压缩到256kbit/秒而不会感觉到任何失真。mpeg伴音利用这个结果,尽管一些mpeg压缩器不支持高质量图像。
mpeg伴音编码可以实现3种压缩等级。等级i是简单压缩,它是一种听觉心理学模型下的亚抽样编码。等级ii加入了更高的精度,等级iii加入了非线性量化,huffman编码和其他实现低速率高保真图像的先进技术。依次下去的等级提供了高质量和越来越高的压缩率,但要求计算机有越来越强的压缩能力。mpeg等级ii可以把一个1.4mbit/秒的立体声数据流压缩到32kbit/秒-384kbit/秒而保持高保真的声音。典型数据为,等级i的目标是每个通道192kbit/秒,等级ii的目标是每个通道128kbit/秒,等级iii的目标是每个通道64kbit/秒。目标ii要达到64kbit/通道时不如等级iii效果好,而在128kbit/通道,等级ii和等级iii的效果一样,而且都比等级i效果好。正如上面所说的,每通道128kbit/秒或者说两通道256kbit/秒可以达到很好的保真度。因此,等级ii对于高保真立体声音响是必要的,但也已足够了。
mpeg-1支持设置为单声道,双声道,立体声或联合立体声的两个声音通道,等级ii的联合立体声把声音信号的高频部分(高于2khz)结合起来,立体图像整个保存下来,但仅传输瞬时包络。等级i不支持两和立体声。有些mpeg压缩器不能产生等时ii的伴音流,从而声音保真度较低而且没有联合立体声功能。
mpeg图像
mpeg图像编码包含3个成分:i帧,p帧和b帧。mpeg编码过程中,一些图像压缩成i帧,一些压缩成p帧,另一些压缩成b帧。i帧压缩可以得到6;1的压缩比而不产生任何可觉察的模糊现象。i帧压缩的同时使用p帧压缩,可以达到更高的压缩比而无可觉察的模糊现象。b帧压缩可以达到200:1的压缩比,其文件尺寸一般为i帧压缩尺寸的15%,不到p帧压缩尺寸的一半。i帧压缩去掉图像的空间冗余度,p帧和b帧去掉时间冗余度,下文将进一步解释。
i帧压缩采用基准帧模式,只提供帧内压缩,即把帧图像压缩到i帧时,仅仅考虑了帧内的图像。i帧压缩不能除去帧间冗余度。帧内压缩基于离散余弦变换(dct),类似于jpeg和h.261图像中使用dct的压缩标准。
p帧采用预测编码,利用相邻帧的一般统计信息进行预测。也就是说,它考虑运动特性,提供帧间编码。p帧预测当前帧与前面最近的i帧或p帧的差别。
b帧为双向帧间编码。它从前面和后面的i帧或p帧中提取数据。b帧基于当前帧与前一帧和后一帧图像之间的差别进行压缩。
mepg数据流开始时对ccir-601规定的sif分辨率的未压缩数字图像进行抽样。sif分辨率,对于ntsc制,就是亮度信号为352*240各像素,每个色度信号都为176*120个象素。各信号都是每秒30帧。mpeg压缩器决定了当前帧以i帧,p帧还是b帧。帧确定之后就采用dct变换,对结果进行量化,舍入,行程编码即变长编码。编码后的典型图像帧序为:ibbpbbpbbpbbibbpbbpbbpbbi…
b帧和p帧要求计算机有更强的功能。有些压缩器不能产生b帧或者连p帧也不能产生,则图像的压缩结果将有很明显的间断。
其他形式的图像压缩
当然,mpeg不是仅有的图像压缩标准。h.261,运动jpeg,cinepak和indeo是最优的替代标准。
h.261和motion-jpeg与mepg采用相似的技术,即都采用离散余弦变换(dct)。然而,jpeg就象mpeg i帧压缩一样,是一种帧内压缩,而且要想不产生可觉察的模糊现象,压缩比不能超过10。因此,要用cd-rom或internet传输图像,jpeg不是一种好的选择,因为它们的压缩比要求达到200:1。h.261可以提供很高的压缩比,然而它不太适用于有大量运动的图像,而最适用于有静态背景的谈话图像。尽管h.261支持通过p帧的帧间压缩,但它不支持b帧压缩。因此,高压缩率的获得是以部分牺牲图像质量为代价的。当图像质量和运动很重要时,h.261将不再是好的选择。
indeo3.2和4.0是专卖的,采用不同的压缩技术。indeo 4.0压缩是两者中较复杂的一种,允许双向预测(b帧)和缩放。一般,indeo4.0压缩用软件实现,速度很慢,尤其是使用b帧编码时尤其如此。indeo的b帧压缩还会造成帧丢失。缩放功能还会造成突变边缘有可觉察的象素化现象及帧的丢失。不用b帧压缩和缩放功能时,320x240分辨率,每秒15帧的图像可以压缩到每秒200kbytes。相比之下,mpeg提供了更高的压缩率,即将352x240分辨率,每秒30帧的图像压缩到每秒150kbyte。
cinepak是由radius公司发展的一种压缩技术,它也是专卖的,压缩速度很慢。一般它提供每秒15帧的cd而不象mpeg为每秒30帧。
参考资料:MPEGl和MPEG2数字视频编码标准
参考技术A 根据人们视听觉的一些不敏感的地方,把视音文件中对人们视听不受影响的部分去掉 参考技术B 为了有助于理解文件压缩,请您在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言,与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色,还不如告诉电脑:“从这个位置开始存储1117个蓝色像点”来得简洁,而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。其实,所有的计算机文件归根结底都是以“1”和“0”的形式存储的,和蓝色像点一样,只要通过合理的数学计算公式,文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说,压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响,这时忽略它们是个好主意,这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中,典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。但是更多情况下压缩数据必须准确无误,人们便设计出了无损压缩格式,比如常见的zip、rar等。压缩软件(compression software)自然就是利用压缩原理压缩数据的工具,压缩后所生成的文件称为压缩包(archive),体积只有原来的几分之一甚至更小。当然,压缩包已经是另一种文件格式了,如果你想使用其中的数据,首先得用压缩软件把数据还原,这个过程称作解压缩。常见的压缩软件有winzip、winrar等。以上是关于请高手详细解释一下的主要内容,如果未能解决你的问题,请参考以下文章
请高手解释一下..烟花在燃放后..在空中怎么才能形成文字或图....急求高手解释..
linux下如何编译安装openssl模块?请高手详细解答一下。。。。。。。。。。【】【】