• 314.50 KB
  • 2022-04-22 13:43:32 发布

图像有损压缩技术的研究毕业论文.doc

  • 40页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'重庆邮电大学移通学院本科毕业设计(论文)图像有损压缩技术的研究毕业论文目录前言1第一章图像压缩技术的研究及进展2第一节图像压缩技术概述2第二节图像压缩技术标准2一、静止图像压缩标准2二、运动图像压缩标准3第三节图像压缩技术分类6第四节图像压缩技术的发展趋势7第五节本章小结7第二章图像有损压缩技术8第一节有损压缩概述8第二节有损压缩机制9第三节本章小结10第三章图像有损压缩的主要编码技术11第一节预测编码11一、脉冲编码调制11二、差分脉冲编码调制12三、自适应差分脉冲编码调制13第二节变换编码14第三节基于模型编码15一、基于语义编码16二、基于物体编码17第四节分形编码18一、分形编码的思路18二、分形编码的方法和步骤19三、分形编码的特点19第五节其它编码201-- 重庆邮电大学移通学院本科毕业设计(论文)一、子带编码20二、矢量量化编码21三、感知编码22第六节本章小结23第四章图像有损压缩与无损压缩比较25第一节有损压缩技术的优缺点25一、有损压缩的优点25二、有损压缩的缺点25第二节无损压缩技术的优缺点26一、无损压缩的优点26二、无损压缩的缺点26第三节两种不同图像压缩方式的综合比较27一、两种压缩方式在精确度上的比较27二、两种压缩方式拥有不同的压缩比率27三、两种压缩方式可逆性的差别27第四节本章小结28结论29致谢30参考文献31附录33一、英文原文33二、英文翻译361-- 重庆邮电大学移通学院本科毕业设计(论文)前言在我们的生活中无论是普通人还是一些工作在科研领域的科技工作者,都会对数据信息进行传输与存储有所接触。随着数字时代的到来,影像的制作、处理和存储都脱离了传统的介质,相比传统方式,数字图像有着传统方式无法比拟的优越性。而对大量图像数据进行传输要保证其传输的质量、速度等,对其进行存储也要考虑其大小容量等。所以,要解决大量图像数据的传输与存储,在当前传输媒介中,存在传输带宽的限制,故在一些限制条件下传输尽可能多的活动图像,如何能对图像数据进行最大限度的压缩,并且保证压缩后的重建图像能够被用户所接受等问题,就成为研究图像压缩技术的问题之源。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。图像数据之所以可以进行压缩,主要是因为一般原始图像数据是高度相关的,都含有大量的冗余信息。图像压缩编码的目的就是消除各种冗余,并在给定的畸变下用尽量少的比特数来表征和重建图像,使它符合预定应用场合的要求。虽然人们总是期望无损压缩,但冗余度很少的信息对象,用无损压缩技术并不能得到可接受的结果。当使用的压缩方法会造成一些信息损失时,关键的问题是看这种损失的影响。有损压缩经常用于压缩音频、灰度或彩色图像和视频对象等,因为它们并不要求精确的数据。在由音频、彩色图像、视频以及其他专门数据组成的多媒体对象中,可以单独使用有损压缩技术,也可与无损压缩技术共同使用。有损压缩编码不具有可恢复性和可逆性,该编码在压缩时舍弃冗余的数据。所以有损压缩技术也走进了人们的视野。1-- 重庆邮电大学移通学院本科毕业设计(论文)第一章图像压缩技术的研究及进展第一节图像压缩技术概述图像压缩就是减少表示数字图像时需要的数据量。是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码[1]。在我们的生活中无论是普通人还是一些工作在科研领域的科技工作者,都会对数据信息进行传输与存储有所接触。随着数字时代的到来,影像的制作、处理和存储都脱离了传统的介质(纸、胶片等),相比传统方式,数字图像有着传统方式无法比拟的优越性。但是每种技术出现的同时,都有制约其发展的一面。比如数字电视、遥感照片、由雷达、飞机等提供的军事侦察图像、可视电话、会议电视和传真照片,在教育、商业、管理等领域的图文资料、CT机、X射线机等设备的医用图像、天气云图等等,无论是利用哪种传输媒介进行传输的信息,都会遇到需要对大量图像数据进行传输与存储的问题。而对大量图像数据进行传输要保证其传输的质量、速度等,对其进行存储也要考虑其大小容量等。所以,要解决大量图像数据的传输与存储,在当前传输媒介中,存在传输带宽的限制,故在一些限制条件下传输尽可能多的活动图像,如何能对图像数据进行最大限度的压缩,并且保证压缩后的重建图像能够被用户所接受等问题,就成为研究图像压缩技术的问题之源。图像数据之所以可以进行压缩,主要是因为一般原始图像数据是高度相关的,都含有大量的冗余信息。图像压缩编码的目的就是消除各种冗余[2],并在给定的畸变下用尽量少的比特数来表征和重建图像,使它符合预定应用场合的要求。第二节图像压缩技术标准一、静止图像压缩标准①JPEG标准:JPEG全名为JointPhotographicExpertsGroup,是一个在国际标准组织(ISO)下从事静止图像压缩标准制定的委员会。JPEG标准从1986年正式开始制订,1988年决定采用以图像质量最好的ADCT(AdaptiveDiscreteCosine38-- 重庆邮电大学移通学院本科毕业设计(论文)Transform)方式为基础的算法作标准,于1991年3月提出10918号标准“连续色调静止图像的数字压缩编码”,即JPEG标准。它在较低的计算复杂度下,能提供较高的压缩比与保真度[3]。JPEG采用4种编解码方式:串行DCT[4](DiscreteCosineTransform)方式、渐进浮现式DCT方式、无失真方式和分层方式。由于JPEG优良的品质,使它在短短几年内就获得极大的成功。随着多媒体应用领域激增,传统的JPEG压缩技术已无法满足人们对多媒体影像资料的要求。因此,更高压缩率以及更多功能的新一代静止影像压缩技术JPEG2000就诞生了。②JPEG2000:JPEG2000[5],正式名称为“ISO15444”,亦是由JPEG组织负责制定。自1997年3月开始筹划,2000年规定基本编码系统的最终协议草案才提出。JPEG2000与JPEG最大的不同,在于它放弃了JPEG所采用的以DCT为主的区块编码方式,而改用以DWT(DiscreteWaveletTransform)为主的多分辨率编码方式。JPEG2000的新特征有:JPEG2000作为JPEG的升级版,具有良好的低比特率性能,特别是对细节丰富的图像以0.25bpp的比特率进行压缩时,总体上其压缩率比JPEG高约30%左右;JPEG2000同时支持有损和无损压缩;而JPEG只支持有损压缩;JPEG2000能实现渐进传送。它先传输图像的轮廓,然后逐步传输图像数据的细节,接收端重构图像时让图像由朦胧到清晰显示,而不像JPEG那样由上到下由左到右的显示;JPEG2000支持所谓的“感兴趣区域”编码(Regionofinterestcoding)。可任意指定图像上感兴趣区域的压缩质量,亦可以选择指定的部分先解压缩以突出重点。二、运动图像压缩标准(一)MPEG系列MPEG(MovingPictureExpertsGroup)运动图像专家组成立于1988年,专门从事运动图像和伴音编码的标准制定。MPEG最初的三个任务是制定1.5Mb/s,10Mb/s,40Mb/s的压缩编码标准,即MPEG-1、MPEG-2、MPEG-3,后因MPEG-2的功能使MPEG-3多余,故MPEG-3被撤消。MPEG-4于1994年开始制定,其目的是实现甚低码率的音/视频压缩编码。MPEG-1是1991年11月提出草案,1992年11月通过,1993年8月公布的。它适用于1.5Mb/s速率的数字存储媒体的运动图像及伴音的压缩编码。MPEG-1追求高的压缩比,去除图像序列的时间冗余度,同时满足多媒体等随机存取的要求。它的图像类型有三种:I图像,采用内部编码,不参照其他图像,亦称内部编码图像[6];P图像,采用预测编码,参照前一幅I或P图像作运动补偿编码,亦称预测编码;B图像,采用双向预测编码,参照前一幅和后一幅I或P图像作双向运动补偿编码,亦称双向预测图像。38-- 重庆邮电大学移通学院本科毕业设计(论文)MPEG-2制定于1994年,其设计目标是高级工业标准的图像质量以及更高的传输率。它进一步提高了压缩比,改善了音频、视频质量,采用的核心技术是分块DCT和帧间运动补偿预测技术。MPEG-2所能提供的传输率在3~10Mb/s间,在NTSC制下的分辨率可达720×486;可提供广播级的视像和CD级的音质;向下兼容MPEG-1,使得大多数MPEG-2解码器可播放MPEG-1格式的数据,如VCD;MPEG-2除了作为DVD的指定标准外,还可以用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频;MPEG-2可提供一个较广范围的压缩比,以适应不同画面质量、存储容量以及带宽的要求。MPEG-4是对数字音/视频数据进行压缩、通信、存取和操作管理等的新标准,并为各种通信环境提供一种通用的技术解决方案。MPEG专家组深入分析了信息领域中计算机、通信以及以电视为代表的消费电器即3C交叉融合的方式后,认为MPEG-4应提供用于通信的新方式,其中心是基于内容的AV信息存储、处理与操作,支持交互性、高压缩比以及通用存储性等功能。在其结构上应具有适应性与可扩张性,以适应软、硬件技术的不断发展,及时融合新的技术。由于MPEG-4的中心是基于内容与交互性的,它就不再对低码率范围做出特别要求。MPEG-4在通信信息描述中,首次提出了对象的概念,如视频对象VO(VideoObject)、音频对象AO(AudioObject)等,这是一个新的飞跃。在编码方案上,MPEG-4仍是以块为基础的混合编码。MPEG-4标准主要应用于视频电话、视频电子邮件和电子新闻等,其传输速率要求较低,在4.8~64kb/s之间,分辨率为176144。MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少数据获得最佳图像质量。MPEG-4更适用于交互AV服务以及远程监控。MPEG-7由MPEG委员会于1998年10月提出提议,2001年9月正式成为国际标准,又称为“多媒体内容描述接口(MultimediaContentDescriptionInterface)”,其目标是建立对多媒体信息内容的标准化描述,试图规范不同种类多媒体信息的描述而不受表达形式的限制。这些描述要与信息内容直接相关以便用来快速有效的查询、访问各种多媒体信息。MPEG-7的应用范围广泛,既可以应用于存储,也可用于流式应用(如广播、将模型加入Internet等)。它可以在实时或非实时环境下应用,如数字图书馆、多媒体编辑等。另外,MPEG-7在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等各方面均有较深的应用潜力。MPEG-21是基于“多媒体框架(MultimediaFramework)标准”38-- 重庆邮电大学移通学院本科毕业设计(论文)的,其最终目的是建立一个多媒体框架,以通过预购网络和设备使多媒体资源在用户之间透明方便的使用。MPEG-21的基本框架要素包括数字项目说明、内容表示、数字项目的识别和描述、内容管理和使用、知识产权管理和保护、终端和网络、事件报告等。它支持的功能有:通过网络存储,使用并交互操作多媒体对象;实现多种业务模型,包括对版权和交易的自动管理;对内容进行隐私的尊重等。目前,这一标准仍处于开发当中。(二)H.26X系列1984年国际电报电话咨询委员会的第23研究组建立了一个专家组专门研究电视电话的编码问题。经过研究与努力,1988年形成草案,1990年12月通过ITU-T的H.261[7]建议。H.261是ITU-T针对可视电话和会议、窄带ISDN等要求实时编码和低延时应用提出的一个编码标准。它允许“采用p64kbit的图像业务的图像编解码”,因而H.261简称p64。其中p是一个整数,取值范围为1~30,对应比特率为64kb/s~1.92Mb/s。它建议采用中间格式CIF(CommonIntermediateFormat)和QCIF(QuarterCIF)解决不同制式通信的矛盾;解决了编码算法问题。H.261采用了运动补偿预测和离散余弦变换相结合的混合编码方案,获得很好的图像压缩效果。1995年,在H.261的基础上,ITU-T总结当时国际上视频图像压缩编码的最新进展,针对低比特率视频应用制定了H.263标准。它提高了运动补偿的精度,常用于超低速率的图像传输,被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结果。之后,ITU-T又对其进行了补充,以提高编码效率,增强编码功能。补充修订的版本有1998年的H.263+,2000年的H.263++。H.263采用第一代编码技术,在低速率视频传输质量,抗误码能力方面有明显提高,在视频业务传输中得到广泛应用。与H.261只能工作在CIF、QCIF两种格式不同,H.263的信源编码器可以工作于5种图像格式:QCIF、Sub-QCIF、CIF、4CIF、16CIF。另外,H.263还在H.261基本编码算法的基础上提供了四种可选编码模式:非限制运动矢量模式、基于语法的算术编码模式、高级预测模式以及PB帧模式。由于仅限于五种固定图像大小、形状和时钟频率,它应用的灵活性较低。H.263+[8]即ITU-T在1998年通过的H.263第二版,增加了12个新的高级模式,修正了第一版中的非限制运动矢量模式。修订版首先在视频格式多样性上做了改进,还提出一些新技术:如附加增强信息模式和增强参考帧再采样模式,进一步扩大适用范围,支持图像冻结和快照,以及多分辨率视频的应用,同时还增加了一些新技术来增强抗误码的能力:如分片结构模式、增强参考帧选择模式等,使视频信号经过压缩编码后能够在具有较大噪声干扰的窄带信道PSTN(IntegrateServicesDigital38-- 重庆邮电大学移通学院本科毕业设计(论文)Network)和无限移动信道等上传输。通过使用去方块效应滤波器,降低分辨率更新模式和修正量化模式等新技术,重建图像的主观质量显著提高。由于H.263+的高级模式有些不能同时使用,有些需结合使用,如何选择合适的编码模式结合,对使用者来说很困难,因此ITU-T于2000年11月提出了H.263++,称为H.263的第三版。它在H.263+的基础上增加了三个高级模式。H.26L[9]标准是ITU-T和ISO/IEC联合制定的最新的图像压缩编码标准,它最先由ITU-T的VCEG于1997年提出的,它的目标是提出一种更高性能的视频质量有实质性提高的视频编码标准。该标准于2003年3月完成,在ITU-T中被称为RecommendationH.264而在ISO/IEC中成为MPEG-4标准的第10部分(ISO/IEC14496-10AVC,简称MPEG-4-10)。H.26L的一个基本概念是引入了两个不同的层次:视频编码层(VCL:VideoCodingLayer)以及网络适配层(NAL:NetworkAdapterLayer),前者负责对视频进行高效的压缩,后者则负责根据网络的传输需要进行编码数据的打包。H.26L相对于其他标准有以下的特点:低码率、高质量、可达到比H.263+提高一倍以上的编码效率;广阔的应用范围,既可用于严格时延限制的实时通信,可用于对时延要求不高的其他应用;稳健性,在网络中传输时,有较强的抗误码性能;对各种网络的友好性,提供了友好的网络接口。第三节图像压缩技术分类图像压缩的优点在于,如抗干扰、处理精度高、灵活性好等,其中主要缺点是数据量太大,传输中占频带太宽。数字图像数据量的压缩按应用不同可分为以下三类:①信息保持型数据压缩(无损压缩):它要求压缩图像的比特数而不丢失任何信息。主要用在图像信息保存中,要求图像存储能保持信息并能快速存取图像。例如短时随机存取主要用于处理过程中的各个环节的存储,它要求经过不同存储介质多次重复不变质、不失真。又如遥感图像,摄取地球上许多地区,因来不及处理,可暂时保存以便以后处理。②保真度型数据压缩:传送的图像应该能够适应通信的通道限制,若接收端是人观看的情况,由于人眼的生理特性不需要过高的空间分辨率和灰度分辨率,因此在压缩过程中允许丢失一些人感觉不到的信息,这就是一种允许微量失真的图像压缩。数字电视、图像传输和多媒体中常用这种压缩。③特征保持型数据压缩(有损压缩):38-- 重庆邮电大学移通学院本科毕业设计(论文)许多图像处理的目的是为了计算机的识别、分析、控制,这时并不需要图像的全部细节及灰度细节。只要能保存图像中的感兴趣的特征信息,无用信息都可丢掉。例如识别军舰类型、巡航导弹地形识别等只要轮廓信息就可以了。又如在机场跑道的识别中农田、房屋信息皆可丢掉,只保留跑道的图像信息即可。这些图像信号可以进行特征保持型数据压缩。图像编码也可以根据编码所在数据域划分为空间域编码和变换域编码。第四节图像压缩技术的发展趋势从国际数据压缩技术的发展尤其是MPEG的发展可以看出,基于内容的图像压缩编码方法是未来编码的发展趋势。它不仅能满足进一步获得更大的图像数据压缩比的要求,而且能够实现人机对话的功能。另外,任意形状物体的模型建立的关键问题还没有解决,这严重影响其应用的广泛性。通过元数据进行编码也是今后编码的发展方向。元数据是指详细的描述音/视频信息的基本元素,利用元数据来描述音视频对象的同时也就完成了编码,因为此时编码的对象是图像的一种描述而不再是图像本身。从另一个角度来说,进一步提高压缩比,提高码流的附属功能(码流内容的可访问性、抗误码能力、可伸缩性等)也将是未来的编码的两个发展方向。第五节本章小结图像压缩技术已经为开拓全新的应用领域打下了坚实的基础。图像压缩技术的基本应用在更深更广层次上的应用就成为我们研究的热点。本章重点对现代图像压缩技术进行概括性介绍。图像压缩就是减少表示数字图像时需要的数据量。是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码。其次介绍了静态与动态图像的压缩标准。最后分别介绍了图像压缩技术的分类。38-- 重庆邮电大学移通学院本科毕业设计(论文)第二章图像有损压缩技术随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。第一节有损压缩概述有损压缩[10]是对利用了人类是绝对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全回复原始数据,但是所损失的部分对理解原始图像的影响缩小有损压缩,却换来了大得多的压缩比。有损压缩广泛应用于语音,图像和视频数据的压缩。常见的声音、图像、视频压缩基本都是有损的。有损压缩可以减少图像在内存和磁盘中占用的空间,在屏幕上观看图像时,不会发现它对图像的外观产生太大的不利影响。因为人的眼睛对光线比较敏感,光线对景物的作用比颜色的作用更为重要,这就是有损压缩技术的基本依据。有损压缩的特点是保持颜色的逐渐变化,删除图像中颜色的突然变化。生物学中的大量实验证明,人类大脑会利用与附近最接近的颜色来填补所丢失的颜色。例如,对于蓝色天空背景上的一朵白云,有损压缩的方法就是删除图像中景物边缘的某些颜色部分。当在·屏幕上看这幅图时,大脑会利用在景物上看到的颜色填补所丢失的颜色部分。利用有损压缩技术,某些数据被有意地删除了,而被取消的数据也不再恢复。无可否认,利用有损压缩技术可以大大地压缩文件的数据,但是会影响图像质量。如果使用了有损压缩的图像仅在屏幕上显示,可能对图像质量影响不太大,至少对于人类眼睛的识别程度来说区别不大。可是,如果要把一幅经过有损压缩技术处理的图像用高分辨率打印机打印出来,那么图像质量就会有明显的受损痕迹。在多媒体应用中,常见的压缩方法[11]有:PCM(脉冲编码调制)38-- 重庆邮电大学移通学院本科毕业设计(论文),预测编码,变换编码,插值和外推法,统计编码,矢量量化和子带编码等,混合编码是近年来广泛采用的方法。mp3、divX、Xvid、jpeg、rm、rmvb、wma、wmv等都是有损压缩。有损数据压缩方法是经过压缩、解压的数据与原始数据不同但是非常接近的压缩方法。有损数据压缩又称破坏型压缩,即将次要的信息数据压缩掉,牺牲一些质量来减少数据量,使压缩比提高。这种方法经常用于因特网尤其是流媒体以及电话领域。在这篇文章中经常成为编解码。它是与无损数据压缩对应的压缩方法。根据各种格式设计的不同,有损数据压缩都会有generationloss:压缩与解压文件都会带来渐进的质量下降。第二节有损压缩机制由于图像数据之间存在这一定的冗余,所以使得数据的压缩成为可能。信息论的创始人Shannon提出把数据看作是信息和冗余度[12](redundancy)的组合。所谓冗余度是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。图像的冗余包括以下几种:①空间冗余:像素点之间的相关性;②时间冗余:活动图像两个连续帧之间的冗余;③信息熵冗余:单位信息量大于其熵;④结构冗余:区域上存在非常强的纹理结构;⑤知识冗余:有固定的结构,如人的头像;⑥视觉冗余:某些图像的失真是人眼不易觉察的。对数字图像进行有损压缩通常利用两个基本原理:一是数字图像的相关性。在图像的同一行相邻像素之间,相邻像素之间,活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也即去除或减少图像信息中的冗余度也就实现了对数字图像的有损压缩。帧内像素的相关称为空域相关性。相邻帧间对应像素之间的相关性称为时域相关性。二是人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分,38-- 重庆邮电大学移通学院本科毕业设计(论文)适当降低编码精度而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像有损压缩的目的。有损压缩有两种压缩机制[13]:①有损变换编解码:首先对图像或者声音进行采样、切成小块、变换到一个新的空间、量化,然后对量化值进行熵编码。②预测编解码:先前的数据以及随后解码数据用来预测当前的声音采样或者图像帧,预测数据与实际数据之间的误差以及其它一些重现预测的信息进行量化与编码。有些系统中同时使用这两种技术,变换编解码用于压缩预测步骤产生的误差信号。第三节本章小结在上一章的基础上,本章则是介绍了图像压缩技术中的一个重要成员,图像有损压缩技术。有损压缩是对利用了人类是绝对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;并从实际应用角度说明了有损压缩技术的特点和应用方向;并简单的介绍了其主流的压缩方法,这一点将在后一章节中详细介绍。最后对有损压缩的机制进行介绍。压缩可以是有损压缩也可以是无损压缩,对于如绘制的技术图、图表或者漫画优先使用无损压缩。38-- 重庆邮电大学移通学院本科毕业设计(论文)第三章图像有损压缩的主要编码技术虽然人们总是期望无损压缩,但冗余度很少的信息对象用无损压缩技术并不能得到可接受的结果。当使用的压缩方法会造成一些信息损失时,关键的问题是看这种损失的影响。有损压缩经常用于压缩音频、灰度或彩色图像和视频对象等,因为它们并不要求精确的数据。在由音频、彩色图像、视频以及其他专门数据组成的多媒体对象中,可以单独使用有损压缩技术,也可与无损压缩技术共同使用。有损压缩编码不具有可恢复性和可逆性,该编码在压缩时舍弃冗余的数据。有损压缩技术逐渐走进了人们的视野。第一节预测编码预测编码[14]是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。预测编码中典型的压缩方法有脉冲编码调制(PCM,PulseCodeModulation)、差分脉冲编码调制(DPCM,DifferentialPulseCodeModulation)、自适应差分脉冲编码调制(ADPCM,AdaptiveDifferentialPulseCodeModulation)等,它们较适合于声音、图像数据的压缩,因为这些数据由采样得到,相邻样值之间的差相差不会很大,可以用较少位来表示。一、脉冲编码调制脉冲编码调制[15](PCM,pulsecodemodulation)是概念上最简单、理论上最完善的编码系统。它是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。PCM的编码原理比较直观和简单,原理框图如图3.1所示。在这个框图中,它的输入是模拟信号,首先经过时间采样,然后对每一样值都进行量化,作为数字信号的输出,即PCM样本序列x(0),x(1),...x(n)。图中的“量化,编码”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。38-- 重庆邮电大学移通学院本科毕业设计(论文)量化[16]有多种方法。最简单的是只应用于数值,称为标量量化,另一种是对矢量(又称为向量)量化。标量量化可归纳成两类:一类称为均匀量化,另一类称为非均匀量化。理论上,标量量化也是矢量量化的一种特殊形式。采用的量化方法不同,量化后的数据量也就不同。因此,可以说量化也是一种压缩数据的方法。t0采样时钟t0t模拟输入0量化,编码x(0)x(1)....x(n)...t图3.1PCM编码框图二、差分脉冲编码调制在PCM系统中,原始的模拟信号经过采样后得到的每一个样值都被量化成为数字信号。为了压缩数据,可以不对每一样值都进行量化,而是预测下一样值,并量化实际值与预测值之间的差值,这就是DPCM(DifferentialPulseCodeModulation,差分脉冲编码调制)。1952年贝尔(Bell)实验室的C.C.Cutler取得了差分脉冲编码调制系统的专利,奠定了真正实用的预测编码系统的基础。DPCM的组成如图3.2,其中编码器和解码器分别完成对预测误差量化值的熵编码和解码。2:1抽取器1:2差值器编信译码码器道器2:1抽取器1:2差值器............高端子带低端子带图3.2DPCM系统原理框图38-- 重庆邮电大学移通学院本科毕业设计(论文)DPCM的优点是算法简单,容易硬件实现,缺点是对信道噪声很敏感,会产生误差扩散。即某一位码出错,对图像一维预测来说,将使该像素以后的同一行各个像素都产生误差;而对二维预测,该码引起的误差还将扩散到以下的各行。这样,将使图像质量大大下降。同时,DPCM的压缩率也比较低。随着变换编码的广泛应用,DPCM的作用已很有限。三、自适应差分脉冲编码调制进一步改善量化性能或压缩数据率的方法是采用自适应量化或自适应预测,即自适应差分脉冲编码调制(ADPCM)。它的核心想法是:利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值。使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。它的编码简化框图如图3.3所示。差分量化器量化阶调整逆量化器预测器y-bit PCM 样本预测PCM样本x-bitADPCM“差值”图3.3ADPCM方框图①自适应量化:在一定量化级数下减少量化误差或在同样的误差条件下压缩数据,根据信号分布不均匀的特点,希望系统具有随输入信号的变化区间足以保持输入量化器的信号基本均匀的能力,这种能力叫自适应量化。自适应量化必须有对输入信号的幅值进行估值的能力,有了估值才能确定相应的改变量。若估值在信号的输入端进行,称前馈自适应;若在量化输出端进行,称反馈自适应。信号的估值必须简单,占用时间短,才能达到实时处理的目的。②自适应预测:预测参数的最佳化依赖信源的特征,要得到最佳预测参数显然是一件繁琐的工作。而采用固定的预测参数往往又得不到较好的性能。为了能使性能较佳,又不致于有太大的工作量,可以采用自适应预测。38-- 重庆邮电大学移通学院本科毕业设计(论文)为了减少计算工作量,预测参数仍采用固定的,但此时有多组预测参数可供选择,这些预测参数根据常见的信源特征求得。编码时具体采用哪组预测参数需根据特征来自适应地确定。为了自适应地选择最佳参数,通常将信源数据分区间编码,编码时自动地选择一组预测参数,使该实际值与预测值的均方误差最小。随着编码区间的不同,预测参数自适应地变化,以达到准最佳预测。第二节变换编码预测编码的压缩能力是有限的。以DPCM为例,一般只能压缩到每样值2~4比特。20世纪70年代后,科学家们开始探索比预测编码效率更高的编码方法。人们首先讨论了KL变换(Karhunen-LoeveTransform)、傅立叶变换等正交变换,得到了比预测编码效率高得多的结果,但苦于算法的计算复杂性太高,进行科学研究可以,实际使用起来很困难。直到20世纪70年代后期,研究者发现离散余弦变换DCT与KL变换在某一特定相关函数条件下具有相似的基向量,而用DCT的变换矩阵来做正交变换就可以节省大量的求解特征向量的计算,因而大大简化了算法的计算复杂性。DCT的使用使变换编码压缩进入了实用阶段。小波变换是继DCT之后科学家们找到的又一个可以实用的正交变换,它与DCT各有千秋,因而分别被不同的研究群体所推崇。变换的基本原理:变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。如将时域信号变换到频域,因为声音、图像大部分信号都是低频信号,在频域中信号的能量较集中,再进行采样、编码,那么可以肯定能够压缩数据。变换编码[17]系统中压缩数据有变换、变换域采样和量化三个步骤。变换本身并不进行数据压缩,它只把信号映射到另一个域,使信号在变换域里容易进行压缩,变换后的样值更独立和有序。这样,量化操作通过比特分配可以有效地压缩数据。在变换编码系统中,用于量化一组变换样值的比特总数是固定的,它总是小于对所有变换样值用固定长度均匀量化进行编码所需的总数,所以量化使数据得到压缩,是变换编码中不可缺少的一步。在对量化后的变换样值进行比特分配时,要考虑使整个量化失真最小。变换编码是一种间接编码方法。它是将原始信号经过数学上的正交变换后,得到一系列的变换系数,再对这些系数进行量化、编码、传输。图3.4是变换编码系统方框图。38-- 重庆邮电大学移通学院本科毕业设计(论文)图中接收端输出信号与输入信号的误差是因为输入端采用量化器的量化误差所致。当经过正交变换后的协方差矩阵为一对角矩阵,且具有最小均方误差时,该变换称为最佳变换,也称Karhunen-Loeve变换[18](K-L变换)。如果变换后的协方差矩阵接近对角矩阵,该类变换称为准最佳变换,典型的有DCT(离散余弦变换)、DFT(离散傅立叶变换)、WHT等。正变换量化器编码器编码信号输出原始信号输入解码信号输入编码信号输入反变换解码器图3.4变换编码、解码原理框图第三节基于模型编码从80年代中后期开始,科学家们开始探讨基于模型的编码,并在包括人脸图像的编码等应用中使用。如果把以预测编码和变换编码为核心的基于波形的编码作为第一代编码技术,则基于模型的编码就是第二代编码技术。N.Jayant指出,压缩编码的极限结果原则上可通过那些能够反映信号产生过程最早阶段的模型而得到。这就是基于模型编码的思想。一个例子是人类发音的“清晰声带—声道模型”(TheArticulatoryVocalCord-VocalTractModel),它把注意焦点从线性预测编码(LPC,LinearPredictiveCoding)分析扩展到声道区分析,原则上为很低码率矢量量化提供了强得多的定义域,并允许更好地处理声带-声道的相互作用。另一个例子是人脸的线框(wire-frame)模型,它为压缩可视电话这类以人脸为主要景物的序列图像提供了一个强有力的手段。基于模型图像编码首先由瑞典Forchheimer等人于1983年提出。基于模型方法的基本思想是:在发送端,利用图像分析模块对输入图像提取紧凑和必要的描述信息,得到一些数据量不大的模型参数;在接收端,利用图像综合模块重建原图像,是对图像信息的合成过程。基本原理如图3.5所示。38-- 重庆邮电大学移通学院本科毕业设计(论文)与经典方法中的预测编码方法类似,基于模型编码在发送端既有分析用的编码器,同时又有综合用的解码器。只有这样,在发送端才能获得与接收端相同的综合后的重建图像,并将后者与原始图像进行“比较”,以确定图像失真是否低于“某种阈值”,以便修正模型参数。同经典方法比较,基于模型编码还有两点显著不同:编码失真。基于模型编码所引起的失真已从传统方法的量化误差转化为几何失真,并可能进一步转化为物理失真或行为失真。编码器已提取的模型参数图像分析图像输入图像传输或存储模型解码器图像综合图像输入已量化的模型参数图3.5基于模型的图像编码基本原理框图如何评价重建图像质量。传统的以像素为单位计算原始图像与重建图像之间“逼真度”(如均方误差、信噪比)不能测量几何失真和物理失真等,从原理上讲根本不适用于基于模型编码。下面分别介绍基于模型的图像编码有两种技术:一种是基于语义编码,一种是基于物体编码。一、基于语义编码基于语义[19](semantic-based)编码采用显示模型(如人物的头肩部分)去分析和合成运动图像,景物里的物体三维模型为严格已知。瑞典Forchheimer等人于1983年提出的就是基于语义图像编码。由于物体模型的有效性,景物中的物体能够在语义水平描述。它可以有效地利用景物中已知物体的知识,实现非常高的压缩比。但它仅能够处理已知物体,并需要较复杂的图像分析与识别技术。为了实现基于语义的图像编码,需要根据景物中特定的一些物体,预先建立它们的通用3D模型,最常用的是3D线框模型。3D线框模型由顶点在3D空间运动的互连多角形复合而成,将色彩信息映射到该模型上就能实现合成。例如,人物头部3D线框模型不仅给出面部的几何形状,而且提供了面部表情的描述。面部表情的变化(例如眨眼、张嘴)可用面部动作编码系统(FACS,FacialActionCodingSystem)中的动作单元(AU,ActionUnit)来描述。FACS给出一个包含了人脸可能产生的全部基本动作(即AU)的集合,而AU38-- 重庆邮电大学移通学院本科毕业设计(论文)是无法分成更小动作的最小动作。把许多AU按照不同的组合方式一起发生,就形成了脸上的丰富表情。下面以视频电话为例说明。在开始通信时,首先把双方的基本特征(例如3D模型、脸部的表面纹理等)传输到对方,建立一个与特定人脸匹配的3D模型。接下来,随着头部的运动和表情的变化,发送端抽取头部的运动参数和脸部的表情参数,编码后传送到对方;接收端根据已知的3D模型和接收到的各种参数,用图像综合技术获得重建图像。系统的关键技术是:人物头、脸及肩部(简称人脸)3D模型的建立;运动参数和表情参数的估计;图像综合。为了使已建立的人脸3D模型如同真实人脸一样“动”起来,必须根据先验知识对脸部进行分析,提取有关的头部特征参数及运动状态参数。基于语义常用的人脸部模型见图3.6,图3.6基于语义编码常用的3D人脸模型(Candide模型)因此,基于语义图像编码还不能适合于所有的视频图像信号。在大多数的情况下,视频图像信号所表现的自然界是多种多样的,够造不出比较合适的模型来表现。目前,基于模型法还是多应用于特定的场合,如上述的视频电话。二、基于物体编码德国Hannover大学的Muman教授在1989年提出的基于物体(object-based或objectoriented)图像编码是针对未知物体的,需要实时构造物体的模型(没有先验知识的)。基于物体编码不采用显示模型,适用于处理更一般的已知或未知的物体,因此预期有更广泛的应用前景。38-- 重庆邮电大学移通学院本科毕业设计(论文)处理时,首先运用图像分析技术,对景物进行分层次的描述,将物体与背景分割出来。对于分割后得到的每个实际三维物体,分别用一个物体模型来描述,并用该模型物体在二维图像平面上的投影(模型图像)来逼近真实图像。基于物体编码只追求最终模型能与输入图像一致,不要求模型物体与真实物体的形状严格一致。因此,假设模型是一个具有一般意义的模型,它既可以是二维的,也可以是三维的。每个分割出来的实际运动物体,用运动参数集、形状参数集和色彩参数集进行描述,然后再对这三个参数集进行编码与传送。根据所假设的物体模型不同,参数集会有些变化。现在基于物体编码所用的模型有4种:2D刚体模型,2D柔体模型,3D刚体模型,3D柔体模型。对于活动图像的基于物体编码系统的核心技术是景物的分层次描述、运动估值和运动分割。从原理上讲,因无需模式识别与先验知识,且不受可视电话中头肩图像那样的限制,对于图像分析要简单得多,因而有更广泛的应用前景。但因未能充分利用景物的知识,或只能在低层次上运用物体知识,编码效率不如基于语义方法。因此应根据实际需要来决定具体选用哪一类方法。目前,基于模型编码进一步的研究方向是把基于物体编码与基于语义编码等结合起来,取长补短。第四节分形编码一、分形编码的思路1988年1月,美国Georgia理工学院的M.F.Barnsley在BYTE发表了分形压缩方法。分形编码法(FractalCoding)的目的是发掘自然物体(比如天空、云雾、森林等)在结构上的自相似形,这种自相似形是图像整体与局部相关性的表现。分形压缩正是利用了分形几何中的自相似的原理来实现的。首先对图像进行分块,然后再去寻找各块之间的相似形,这里相似形的描述主要是依靠仿射变换确定的。一旦找到了每块的仿射变换,就保存下这个仿射变换的系数,由于每块的数据量远大于仿射变换的系数,因而图像得以大幅度的压缩。分形编码以其独特新颖的思想,成为目前数据压缩领域的研究热点之一。分形编码、基于模型编码与经典图像编码方法相比,在思想和思维上有了很大的突破,理论上的压缩比可超出经典编码方法两三个数量级。38-- 重庆邮电大学移通学院本科毕业设计(论文)二、分形编码的方法和步骤以平面点集合与图像为例,迭代函数[20]系统压缩编码大致步骤为:①图像分割:首先将原图(集合X或图像)预分割(或预分解)为若干分形子图X(m)(m=1,2,…,M),使得每一个子图X(m)具有一定的分形结构,及其局部与整体之间保持某种相似特征。而这种子图分割可以是空间域分割,也可以是频率域或其他空间域分割。在总图像的分割中,常常把同类或者相近的物体放在同一子图中,而把不同的景物,如山脉、河流、沙漠、云雾、森林、草地等,分别置于不同的子图中。②提取迭代函数系统(IFS)代码:在分割完分形子图X(m)之后,对每一个分形子图提取IFS代码,其方法是:将子图X(m)置于计算机屏幕上,利用人机对话方式,对X(m)进行压缩处理(可伸缩、平移、旋转和仿射等),生成X(m)的一个仿射图X(m)j,这个仿射图应该覆盖原始子图X(m)的一部分。于是可得所谓仿射变换:X(m)X(m)j即通过仿射变换,由子图X(m)生成X(m)的仿射图X(m)j。③对IFS代码进行编码:获得了原图的IFS代码之后,可按子图X(m)或仿射图X(m)j的预测加权,用常规编码方法对IFS代码进行编码。三、分形编码的特点分形编码的最显著的特点是自相似性(self-similarity)。与经典方法相比,它不但去除了数据之间局部的相关性,而且去除整体与局部之间的相关性,所以有望达到经典编码方法所达不到的压缩比,是一种思想全新、很有潜力的编码技术。分形编码的主要特点有:分形编码的图像压缩比经典编码方法的压缩比高出许多;由于分形编码可把图像划分成大得多、形状复杂得多的区分,故压缩所得的文件的大小不会随着图像像素数目的增加即分辩率的提高而变大。而且,分形压缩还能依据压缩时确定的分形模型,给出高分辨率的清晰的边缘线,而不是将其作为高频分量加以抑制;分形压缩和解压缩不对称,压缩较慢,而解压缩很快。这是由于对每块确定仿射变换时,要对整幅图像进行相似性搜索,因而较慢。而恢复时只需简单的反复叠代过程,因而较快。38-- 重庆邮电大学移通学院本科毕业设计(论文)第五节其它编码一、子带编码子带编码(SBC,SunbandCoding)是一种在频率域中进行数据压缩的方法。在子带编码中,首先用一组带通滤波器将输入信号分成若干个在不同频段上的子带信号,然后将这些子带信号经过频率搬移转变成基带信号,再对它们在奈奎斯特速率上分别重新取样。取样后的信号经过量化编码,并合并成一个总的码流传送给接收端。在接收端,首先把码流分成与原来的各子带信号相对应的子带码流,然后解码、将频谱搬移至原来的位置,最后经带通滤波、相加,得到重建的信号。图3.7给出了子带编码、解码的工作原理图。频率搬移频率搬移频率搬移量化编码量化编码量化编码带通滤波带通滤波带通滤波复用(a)编码器分接译码译码译码频率搬移频率搬移频率搬移带通滤波带通滤波带通滤波(b)解码器图3.7子带编码、解码工作原理图在子带编码中,若各个子带的带宽ΔWk是相同的,则称为等带宽子带编码,否则,称为变带宽子带编码。对每个子带分别编码的好处是:38-- 重庆邮电大学移通学院本科毕业设计(论文)可以利用人耳(或人眼)对不同频率信号的感知灵敏度不同的特性,在人的听觉(或视觉)不敏感的频段采用较粗糙的量化,从而达到数据压缩的目的。例如,在声音低频子带中,为了保护音调和共振峰的结构,就要求用较小的量化阶、较多的量化级数,即分配较多的比特数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的比特数。各个子带的量化噪声都束缚在本子带内,这就可以避免能量较小的频带内的信号被其他频带中量化噪声所掩盖。通过频带分裂,各个子带的取样频率可以成倍下降。例如,若分成频谱面积相同的N个子带,则每个子带的取样频率可以降为原始信号取样频率的1/N,因而可以减少硬件实现的难度,并便于并行处理。1976年子带编码技术首次被美国贝尔实验室的R.E.Crochiere等人应用于语音编码。二、矢量量化编码矢量量化编码也是在图像、语音信号编码技术中研究得较多的新型量化编码方法,它的出现并不仅仅是作为量化器设计而提出的,更多的是将它作为压缩编码方法来研究的。在传统的预测和变换编码中,首先将信号经某种映射变换变成一个数的序列,然后对其一个一个地进行标量量化编码。而在矢量量化编码中,则是把输入数据几个一组地分成许多组,成组地量化编码,即将这些数看成一个k维矢量,然后以矢量为单位逐个矢量进行量化。矢量量化是一种限失真编码,其原理仍可用信息论中的率失真函数理论来分析。而率失真理论指出,即使对无记忆信源,矢量量化编码也总是优于标量量化。图3.8示出了矢量量化编码的原理框图。搜索传输矢量下标信道查表输入矢量回本回本输出矢量图3.8矢量量化编码原理框图图3.8中输入信号是一个k维矢量,该矢量原则上既可以是原始图像,也可以是图像的预测误差或变换矩阵系数的分块(或称分组)。码本C是一个k维矢量的集合,即C={Yi},i=1,2,…,N,它实际上是一个长度为N的表,每个表的每个分量是一个k38-- 重庆邮电大学移通学院本科毕业设计(论文)维矢量,称为码字。矢量编码的过程就是在码本C中,搜索一个与输入矢量最接近的码字。衡量两个矢量之间接近程度的度量标准可以用均方误差准则:(3.1)也可以用其他准则,如:(3.2)传输时,只需传输码字Yi的下标i在接收端解码器中,有一个与发送端相同的码本C,根据下标i可简单地用查表法找到Yi作为对应X的近似。当码本长度为N时,为传输矢量下标所需的比特数为log2N,平均传输每个像素所需的比特数为(1/k)log2N。若k=16,N=256,则比特率为0.5bit/pixel在矢量量化编码中,关键是码本的建立和码字搜索算法。码本的生成算法有两种类型,一种是已知信源分布特性的设计算法;另一种是未知信源分布,但已知信源的一列具有代表性且足够长的样点集合(即训练序列)的设计算法。可以证明,当信源是矢量平衡且遍历时,若训练序列充分长则两种算法是等价的。码字搜索是矢量量化中的一个最基本问题,矢量量化过程本身实际上就是一个搜索过程,即搜索出与输入最为匹配的码矢。矢量量化中最常用的搜索方法是全搜索算法和树搜索算法。全搜索算法与码本生成算法是基本相同的。在给定速率下其复杂度随矢量维数K以指数形式增长,全搜索矢量量化器性能好但设备较复杂。树搜索算法又有二叉树和多叉树之分,它们的原理是相同的,但后者的计算量和存储量都比前者大,性能比前者好。树搜索的过程是逐步求近似的过程,中间的码字是起指引路线的作用,其复杂度比全搜索算法显著减少,搜索速度较快。由于树搜索并不是从整个码本中寻找最小失真的码字,因此它的量化器并不是最佳的,其量化信噪比低于全搜索。三、感知编码感知编码将感知知识应用于编码中。感知编码已经在声音编码中得到了应用。心理声学模型中一个基本的概念就是听觉系统中存在一个听觉阈值,低于这个阈值的声音信号就听不到。听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。大多数人的听觉系统对2kHz~5kHz38-- 重庆邮电大学移通学院本科毕业设计(论文)之间的声音最敏感。一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。显然,低于听觉阈值的信号在声音压缩时可以去掉。心理声学模型中的另一个概念是听觉掩蔽效应,即一个强的语音信号可以掩盖一个相邻的弱信号。例如,同时有两种频率的声音存在,一种是1000Hz的声音,另一种是1100Hz的声音,但它的强度比前者低18分贝,在这种情况下,1100Hz的声音就听不到。也许你有这样的体验,在一安静房间里的普通谈话可以听得很清楚,但在播放摇滚乐的环境下同样的普通谈话就听不清楚了。声音压缩算法也同样可以根据这种特性,去掉更多的冗余数据。图3.9说明了感知编码的基本方法。方框图的大部分功能都是基于频域的,因为人的听觉过程很容易用频域法理解。感知编码的主要步骤是:首先将输入信号分解为各频谱元素,再根据某个心理听觉阈值和掩蔽门限进行量化编码,最后生成比特流。听觉阈值和掩蔽门限的计算,需要对输入信号进行频域分解。我们可以采用与量化编码相同的频域分解方法,也可用到前面所说的独立分析方法。方法的选择要视复杂度和精度而定。分析滤波部件可以进行正交滤波分解,或者再加上某种离散变换。虽然离散变换可看成一个均匀子带滤波组,但二者的差别仍然存在。无论听觉阈值和掩蔽门限的计算是基于原输入信号的分析还是基于独立的频域分析,其计算结果都可用于规定各频率元素编码的精度。计算结果可以是听觉阈值和掩蔽门限的集合,各频率元素所分配的比特数,或者是实现透明质量所需的频率相关的信噪比集合。量化和编码都有很多种实现方法,从直接计算标量量化中的比特分配到利用分解综合系统,都可以实现量化编码。这里所说的分析滤波是指先比较量化与非量化的频谱元素,找到每个频谱元素的量化噪声,最后将此噪声与听觉阈值和掩蔽门限比较。音频输入比特流输出比特流编码量化和编码分析滤波器组感知模型图3.9感知编码策略的基本结构框图第六节本章小结38-- 重庆邮电大学移通学院本科毕业设计(论文)本章就有损图像压缩技术进行更深层次的介绍。主要介绍了当下主流的压缩编码技术:预测编码、变换编码、分形编码、基于模型编码、其他编码等。而在这些常用的压缩方法中预测编码压缩技术是目前应用最广泛的编码技术之一。预测编码分为无失真预测编码和有失真预测编码。无失真预测编码是指对预测误差不进行量化,所以,不会丢失任何信息。有失真编码要对预测误差进行量化处理,而量化必然产生一的误差。随着发展必然会有功能更全面的更有效的图像压缩编码技术的产生。38-- 重庆邮电大学移通学院本科毕业设计(论文)第四章图像有损压缩与无损压缩比较伴随着科技的发展,在多媒体压缩范畴内,人们通过对信源建模表达认识的不断深化,进而使压缩技术得到了更大的发展。图像的编码与压缩的目的就是对图像数据按一定的规则进行变换和组合,从而达到用尽可能少的代码(符号)来表示尽可能多的图像信息。当前,对图像压缩的方法主要有无损压缩与有损压缩两种,而这两种压缩方法又有着不同的特点,通过对不同压缩方法的比较,可以在实践中获得更高的图像水平与工作效率。第一节有损压缩技术的优缺点一、有损压缩的优点有损压缩方法的一个优点就是在有些情况下,能够获得比任何已知无损方法小得多的文件大小,同时又能满足系统的需要。当用户得到有损压缩文件的时候,譬如为了节省下载时间,解压文件与原始文件在数据位的层面上看可能会大相径庭,但是对于多数实用目的来说,人耳或者人眼并不能分辨出二者之间的区别。有损方法经常用于压缩声音、图像以及视频。有损视频编解码几乎总能达到比音频或者静态图像好得多的压缩率(压缩率是压缩文件与未压缩文件的比值)。音频能够在没有察觉的质量下降情况下实现10:1的压缩比,视频能够在稍微观察质量下降的情况下实现如300:1这样非常大的压缩比。有损压缩图像的特点是保持颜色的逐渐变化,删除图像中颜色的突然变化。生物学中的大量实验证明,人类大脑会利用与附近最接近的颜色来填补所丢失的颜色。例如,对于蓝色天空背景上的一朵白云,有损压缩的方法就是删除图像中景物边缘的某些颜色部分。当在屏幕上看这幅图时,大脑会利用在景物上看到的颜色填补所丢失的颜色部分。利用有损压缩技术,某些数据被有意地删除了,而被取消的数据也不再恢复。二、有损压缩的缺点有损静态图像压缩经常如音频那样,能够得到原始大小的1/1038-- 重庆邮电大学移通学院本科毕业设计(论文),但是无可否认,利用有损压缩技术是会影响图像质量,尤其是在仔细观察的时候,质量下降更加明显。另外,如果使用了有损压缩的图像仅在屏幕上显示,可能对图像质量影响不太大,至少对于人类眼睛的识别程度来说区别不大,因为人的眼睛对光线比较敏感,光线对景物的作用比颜色的作用更为重要。可是,如果要把一幅经过有损压缩技术处理的图像用高分辨率打印机打印出来,那么图像质量就会有明显的受损痕迹。第二节无损压缩技术的优缺点一、无损压缩的优点无损压缩格式就如同用Zip压缩文件一样,能100%的保存WAV文件的全部数据,没有任何信号丢失。其次,无损压缩相对于有损压缩在处理音频文件时(CD)有着音质高,不受信号源的影响的优势。而有损压缩格式由于其先天的设计(需要丢失一部分信号),所以音质再好,也只能是无限接近于原声CD,要想真正达到CD的水准是不可能。而且由于有损压缩格式算法的局限性,在压缩交响乐等类型动态范围大的音乐时,其音质表现不尽人意。而无损压缩格式则不存在这样的问题。最后,无损压缩较有损压缩更容易转换。无损压缩格式可以很方便地还原成WAV,还能直接转压缩成MP3、Ogg等有损压缩格式,甚至可以在不同无损压缩格式之间互相转换,而不会丢失任何数据。因为有损压缩格式的二次编码(从一种有损格式转换成另一种有损格式,或者格式不变而调整比特率)意味着丢失更多的信号,带来更大的失真。二、无损压缩的缺点占用空间大,压缩比不高是它第一个缺陷。比起有损压缩格式来,无损压缩格式的压缩能力要差得多,一般都在60%左右。而192Kbps的有损格式只有原文件的14%左右,两者在压缩率上的差异相当悬殊。其次,缺乏硬件的支持也是明显的劣势。从本质上看,无损压缩的方法可以删除一些重复数据,大大减少要在磁盘上保存的图像尺寸。但是,无损压缩的方法并不能减少图像的内存占用量,这是因为,当从磁盘上读取图像时,软件又会把丢失的像素用适当的颜色信息填充进来。如果要减少图像占用内存的容量,就必须使用有损压缩方法。38-- 重庆邮电大学移通学院本科毕业设计(论文)第三节两种不同图像压缩方式的综合比较一、两种压缩方式在精确度上的比较图像的无损压缩主要利用的是基于统计概率的方法和基于字典的技术。通过霍夫曼编码和游程编码等编码方式进行具体的操作。从而使图像在压缩时损失较少的信息,进而拥有较高的精确度。图像的有损压缩则是运用有损预测编码方法和变换编码方法,通过减少像素之间的联系,进行高密度的压缩。因而对于对图像精确度要求较高的图片应当优先选用无损压缩。比如,在对艺术作品进行压缩传输时,为了保证较高的图片质量,应当使用精确度较高的无损压缩技术。如果使用有损压缩,则会使文件的内容受到影响。但是,对于部分不需要较高精确度或者压缩后并不影响其表达内容的图像,则可以使用有损压缩。二、两种压缩方式拥有不同的压缩比率图像的无损压缩运用适当的编码技术,由于像素之间的联系被几乎完整的保留了下来,所以图像更精确,这样以来压缩比率就比较小,占用空间较大;而有损压缩却以丢失部分图像信息为代价,去除图像中的次要部分,只保留主要部分,从而使图像压缩的更小,使得压缩比率大大提高。比如在互联网中十分流行的JPEG格式图片,就是利用有损压缩的离散余弦变换编码技术进行大比特率压缩,从而在网络数据交换时,同等条件下,拥有更好的传输速率。三、两种压缩方式可逆性的差别无损压缩利用信息相关性进行的数据压缩,并且不损失原信息的内容,能够准确无误地重现原始数字波形数据,所以这种压缩是可逆的。有损压缩利用了人类对图像中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息,因此,无法完全复原出原始数据的信息,所以这种压缩是不可逆的。中国蓝光高清光盘(CBHD)就是运用了一种无损压缩技术使得在播放的时候能够还原较高的图像清晰度。3GP则是MP4格式的一种简化版,它运用的就是一种有损压缩技术,从而减少了存储空间和较低的频宽需求,让手机有限的存储空间可以使用,但是这种压缩方法无法在播放时使图像恢复到较高的水平。38-- 重庆邮电大学移通学院本科毕业设计(论文)第四节本章小结本章节为了更加直观深刻的了了解有损压缩,将图像的无损压缩技术与之相比较,从不同的方面剖析有损压缩技术在当今图像压缩中有何优势和特点,其次,将有损压缩技术与无损压缩技术相比较,分别从压缩方式的精确度以及压缩比率和可逆性对比说明有损要压缩的技术优势和应用方向。进而发现:对于如绘制的技术图、图表或者漫画优先使用无损压缩,这是因为有损压缩方法,尤其是在低的位速条件下将会带来压缩失真。如医疗图像或者用于存档的扫描图像等这些有价值的内容的压缩也尽量选择无损压缩方法。有损方法非常适合于自然的图像,或者是想表达某些特定信息的图像。例如一些应用中图像的微小损失是可以接受的(有时甚至是无法感知的),这样就可以大幅度地减小位速,提高工作效率。38-- 重庆邮电大学移通学院本科毕业设计(论文)结论论文通过对有损压缩的研究得出:有损压缩经常用于压缩音频、灰度或彩色图像和视频对象等,因为它们并不要求精确的数据。在由彩色图像以及其他专门数据组成的多媒体对象中,可以单独使用有损压缩技术,也可与无损压缩技术共同使用。有损压缩编码不具有可恢复性和可逆性,该编码在压缩时会舍弃冗余的数据。有损压缩编码技术中预测编码技术占据主导地位,甚至在整个压缩领域里,预测编码技术相比较其他编码技术也更加成熟。其中的脉冲编码调制是概念上最简单、理论上最完善的编码系统。它是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。本文将有损压缩与无损压缩结合并进行综合比较得出:有损压缩有其自身的特点和优势。例如有损压缩方法的一个优点就是在有些情况下能够获得比任何已知无损方法小得多的文件大小,同时又能满足系统的需要。当用户得到有损压缩文件的时候,譬如为了节省下载时间,解压文件与原始文件在数据位的层面上看可能会大相径庭,但是对于多数实用目的来说,人耳或者人眼并不能分辨出二者之间的区别。其次,有损压缩却丢失部分图像信息为代价,去除图像中的次要部分,只保留主要部分,从而使图像压缩的更小,使得压缩比率大大提高。比如在互联网中十分流行的JPEG格式图片,就是利用有损压缩的离散余弦变换编码技术进行大比特率压缩。最后,有损压缩利用了人类对图像中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息,因此,无法完全复原出原始数据的信息,所以这种压缩是不可逆的。二十一世纪,伴随着多媒体信息技术、互联网、可视移动通信技术等的广泛使用和发展,对图像的压缩质量的要求也越来越高,需要更多更好的图像压缩的新思想、新技术,从这些图像压缩的新思想、新技术的发展趋势可以看出现代压缩方法的特点:充分考虑人的视觉特性;恰当适宜地考虑对图像信号的分解与表述;采用图像的合成与识别方案压缩数据。38-- 重庆邮电大学移通学院本科毕业设计(论文)致谢非常感谢高飞讲师在我大学的最后学习阶段——毕业设计阶段给自己的指导,从最初的定题,到资料收集,到写作、修改,到论文定稿,严格把关,循循善诱,他给了我耐心的指导和无私的帮助。为了指导我的毕业论文,他放弃了自己的休息时间,他的这种无私奉献的敬业精神令人钦佩,值此论文完成之际,我向我的导师表示衷心的感谢和崇高的敬意!同时,感谢所有任课老师和所有同学在这四年来给自己的指导和帮助,是他们教会了我专业知识,教会了我如何学习,教会了我如何做人。正是由于他们,我才能在各方面取得显著的进步,在此向他们表示我由衷的谢意,并祝所有的老师培养出越来越多的优秀人才,桃李满天下!通过这一阶段的努力,我的毕业论文终于完成了,这意味着大学生活即将结束。在大学阶段,我在学习上和思想上都受益非浅,这除了自身的努力外,与导师、同学和朋友的关心、支持和鼓励是分不开的。最后,向所有关心我的亲人、师长和朋友们表示深深的谢意!38-- 重庆邮电大学移通学院本科毕业设计(论文)参考文献[1]尹显东,李在铭,姚军.图像压缩标准研究的发展与前景[M].北京:北京邮电大学出版社,2003.1(4):326-331[2]薛文通,宋建设,袁礼海,沈涛.图像压缩技术的现状与发展[M].北京:电子工业出版社,2003.65-67[3]朱秀昌,刘峰,胡栋.数字图像处理与图像通信[M].北京:北京邮电大学出版社,2002.199-204[4]MichaelW,MarcellinA,AnoverviewofJPEG-2000[A].Proc.IEEEDataCompressionConference[C],2000.[5]夏得深,傅得胜.现代图像处理技术与应用[M].南京:东南大学出版社,2001.84-85[6]刘方敏,吴永辉,俞建新.JPEG2000图像压缩技术过程及原理概述[J].计算机辅助设计与图形学学报,2002.14(10):905-916[7]Luttrell5P.ImageComPressionUsingNeuralNetworks.In:Proe.IGARSS’88,SePt[J].1988.PP.1231-1238,Edinburgh,Seotland[8]AhaltSC,ChenP,MeltonDE.ComPetitiveLearningAlgorithmsforVectorQuantizationTechniquesNeuralNetworks,vol.3,PP.277-290,1990.[9]蔡安妮,孙景鳌编著.多媒体通信技术基础[M]:电子工业出版社,2000年8月.[10]潘志庚、叶绿、耿卫东等.多媒体技术计算、通信和应用[M]:清华大学出版社,2000年3月.[11]ZeimerRE,PetersonRL.DigitalCommunieationandSpreadSpectrumSystems[J].JohnWiley&sons,1985.[12]潘志庚、叶绿、耿卫东等.多媒体技术计算、通信和应用[M]:清华大学出版社,2000年3月.[13]ZeimerRE,PetersonRL.DigitalCommunieationandSpreadSpectrumSystems[J].JohnWiley&sons,1985.[14]马社祥,刘忠贵,尚赵伟.基于小波变换的图像和压缩编码[J].工程数学学报,2001.18(5):18-3038-- 重庆邮电大学移通学院本科毕业设计(论文)[1]MajidRabbani,RajanJoshi.AnoverviewoftheJPEG2000stillimagecompressionstandard.SignalProcessing:ImageCommunication,2002.17:3–48[2]ITU-TRecommendationH.261,Videocodingforaudiovisualservicesatp×64kbit[S].Rev.2,1993.[3]ITU-TRecommendationH.263Version2(H.263+),VideocodingforLowBitRateCommunication[S].1998.[4]Chi-ChangKuoa,Jin-JangLeoub.AnewratecontrolschemeforH.263videotransmission.SignalProcessing:ImageCommunication,2002.17:537-557[5]JamesT.H.Chung-How,DavidR.BullLossresilientH.263+videoovertheInternet.SignalProcessing:ImageCommunication,2001.16:891-908[6]Sheng-WeiLin,Jin-JiangLeou,andLi-WeiKang,AnerrorresilientcodingschemeforH.26Lvideotransmissionbasedondataembedding.JVisCommun.ImageR,2004.15:214-24038-- 重庆邮电大学移通学院本科毕业设计(论文)附录一、英文原文ModernmobilecommunicationtechnologyInnowhighlytheinformationsociety,theinformationandthecorrespondencehavebecomethemodernsociety“thelife”.Theinformationexchangemainlyreliesonthecomputercorrespondence,butcorrespondstakesthetransmissionmethod,withthesensingtechnology,thecomputertechnologyfusesmutually,hasbecomeinthe21stcenturytheinternationalsocietyandtheworldeconomicdevelopmentpowerfulengine.Inordertoofadaptthetimerequest,thenewgenerationofmobilecommunicationtechnologyseasonableandlives,thenewgenerationofmobilecommunicationtechnologyisthepeoplesaidthatthirdgeneration"scorecharacteristicisthewidebandaddressingturnsonnon-gaproamingbetweentherigidnetworkandnumerousdifferentcommunicationssystem"s,gainsthemultimediacommunicationservices.Alongwiththetimeprogress,thetechnicalinnovation,people"sliferequest"senhancement,themobilecommunicationtechnologyrenewalspeedisquiteastonishing,almosteveryothertenyearmobilecommunicationtechnologyhasatransformationupdate,fromthe1980s“themobilephone”topresent"s3Ghandset,duringhashadtwomobilecommunicationtechnologytransformation,transitsfrom1GAMPSto2GGSM,fromGSMtoIMT-2000(i.e.3Gtechnology).Knowsmodernonmethemobilecommunicationtechnologytohavethefollowingseveralaspectimportanttechnology:1.widebandmodulationandmultipleaccesstechniqueThewirelesshighspeeddatatransmissioncannotonlydependonthefrequencyspectrumconstantlytheexpansion,shouldbehigherthanthepresentnumbermagnitudeatleastinthefrequencyspectrumefficiency,mayusethreetechnologiesinthephysicallevel,namelyOFDM,UWBandfreetimemodulationcode.OFDMwithotherencodingmethod"sunion,nimblyOFDMandTDMA,FDMA,CDMA,SDMAcombinesthemultipleaccesstechnique.Inthe1960stheOFDMmulti-channeldatatransmissionhassucceededusesincomplexandtheKathrynhighfrequencymilitarychannels.OFDMhasusedin1.6Mbit/shighbitratedigitalsubscriberline(HDSL),6Mbit/sasymmetricaldigitalsubscriberline(ADSL),100Mbit/sreallyhighspeedfiguresubscriber"sline(VDSL),digitalaudiofrequencybroadcastanddigitalvideobroadcastandsoon.OFDMapplieson5GHzprovides54Mbit/swirelesslocalnetworkIEEE802.11aandIEEE802.11g,highperformancethisregionnetworkHiperLAN/2andETSI-BRAN,butalsotakesmetropolitanareanetworkIEEE802.16andtheintegratedservicedigitbroadcast(ISDB-T)thestandard.Compareswiththesingleloadfrequencymodulationsystemservicepattern,theOFDMmodulationservicepatternneedstosolvetherelativelybigpeakevenpowerratio(PAPR,PeaktoAveragePowerRatio)andtothefrequencyshiftingandthephasenoisesensitivequestion.38-- 重庆邮电大学移通学院本科毕业设计(论文)Highspeedmobilecommunication"sanotherrequestisunderthewidenoisebandwidth,mustdemodulatethesignal-to-noiseratiotoreduceasfaraspossible,thusincreasesthecoverarea.Mayadopttheanti-fadingthefullstartpowercontrolandthepilotfrequencyauxiliaryfasttrackdemodulationtechnology,likethefrequencyrangeanti-fading"sRakereceiveandthetracktechnology,theOFDMAtechnologywhichdeclinesfromthetimedomainandthefrequencyrangeresistancetimeandthefrequencyselectivity,thelinkauto-adaptedtechnology,theunioncodingtechnique.2.frequencyspectrumusefactorlifttechniqueThefundamentalresearchpointedout:IntheindependentRayleighscatteringchannel,thedatarateandtheantennaseveraltenthlinearrelationships,thecapacitymayreachShannon90%.Islaunchingandthereceivingendmayobtainthecapacityandthefrequencyspectrumefficiencygainbythemulti-antennadevelopmentchannelspace.TheMIMOtechnologymainlyincludesthespatialmultiplyingandthespacediversitytechnology,concurrentorthesalvosameinformationenhancesthetransmissionreliabilityontheindependentchannel.Receivesanddispatchesthebilateralspacediversityisthehigh-capacitywirelesscommunicationsystemusesoneoftechnical.BellLabfreetime"soppositeangleBLAST(D-BLAST)capacityincreasetoreceiveanddispatchthebilateralsmallestantennanumberinadministrativelevelsthefunction.ThecrosstimedomainwhichandtheairzoneexpansionsignalconstitutesusingMIMOmayalsoresistthemulti-diameterdisturbance.V-BLASTsystemwhenindoor24~34dB,thefrequencyspectrumusefactoris20~40bit/s/Hz.Butlaunchesandthereceivingenduses16antennas,when30dB,thefrequencyspectrumusefactorincreasesto60~70bit/s/Hz.Thesmartantennaautomatictrackingneedsthesignalandtheauto-adaptedfreetimeprocessingalgorithm,producesthedimensionalorientationwavebeamusingtheantennaarray,causesthemainwavebeamalignmentsubscribersignaldirectionofarrivalthroughthedigitalsignalprocessingtechnology,thesidelobeorzerofallsthealignmentunwantedsignaldirectionofarrival.Theauto-adaptedarrayantennas(AAA,AdaptiveArrayAntennas)disturbsthecounter-balancebalancer(ICE,InterferenceCancelingEqualizer)tobepossibletoreducedisturbsandcutstheemissivepower.3.softwareradiotechnologyThesoftwareradiotechnologyisinthehardwareplatformthroughthesoftwareeditionbyaterminalimplementationdifferentsysteminmanykindsofcommunicationservices.Itusesthedigitalsignalprocessinglanguagedescriptiontelecommunicationpart,downloadsthedigitalsignalprocessinghardwarebythesoftwareroutine(DSPH,DigitalSignalProcessingHardware).Byhasthegeneralopeningwirelessstructure(OWA,OpenWirelessArchitecture),compatiblemanykindsofpatternsbetweenmanykindsoftechnicalstandardsseamlesscut.UWBisalsocalledthepulsetoberadio,themodulationusesthepulsewidthinthenanosecondlevelfastriseandthedroppulse,thepulsecoverfrequencyspectrumfromthecurrenttotheluckyhertz,doesnotneedintheradiofrequencywhichtheconventionnarrowbandfrequencymodulationneedstotransform,afterpulseformation,maydeliverdirectlytotheantennalaunch.4.softwareradiotechnologyThesoftwareradiotechnologyisinthehardwareplatformthroughthesoftwareeditionbyaterminalimplementationdifferentsysteminmanykindsofcommunicationservices.Itusesthedigitalsignalprocessinglanguagedescriptiontelecommunicationpart,downloadsthedigital38-- 重庆邮电大学移通学院本科毕业设计(论文)signalprocessinghardwarebythesoftwareroutine(DSPH,DigitalSignalProcessingHardware).Byhasthegeneralopeningwirelessstructure(OWA,OpenWirelessArchitecture),compatiblemanykindsofpatternsbetweenmanykindsoftechnicalstandardsseamlesscut.5.networksecurityandQoSQoSdividesintowirelessandthewiredsidetwoparts,wirelessside"sQoSinvolvestheradioresourcemanagementandthedispatch,theadmissioncontrolandthemobilitymanagementandsoon,themobilitymanagementmainlyincludestheterminalmobility,individualmobilityandservicemobility.Wiredside"sQoSinvolvesbasedontheIPdifferdiscriminationserviceandtheRSVPend-to-endresourcesreservationmechanism.MechanismmapsthewirelesssideIPdifferIPtheQoS.Networksecurityincludingnetworkturningonsecurity,corenetworksecurity,applicationsecurity,safetymechanismvisibilityandconfigurable.Intheabovemodernmobilecommunicationkeytechnologies"foundation,hashadthelandhoneycombmobilecommunication,thesatellitecommunicationaswellasthewirelessInternetcommunication,thesemailingaddresscausedthecorrespondenceappearancetohavethehugechange,usedthedigitaltechniquethemodernwirelesscommunicationalreadytopermeatethenationaleconomyeachdomainandpeople"sdailylife,forthisreason,weneededtocarethatitstrendofdevelopment,hopeditdevelopedtowardmoreandmoreconvenientpeople"slife"sdirection,willletnowushavealookatthemodernmobilecommunicationthefuturetrendofdevelopment.modernmobilecommunicationtechnologicaldevelopmentsevennewtendencies:First,mobilitymanagementalreadyfromterminalmanagementtoindividualmanagementandintelligentmanagementdevelopmentSecond,networkalreadyfromsynchronizeddigitalcircuittoasynchronousdigitalgroupingandasynchronoustransfermode(ATM)development;thethree,software"sdevelopmentsactuatedfromthealgorithmtotheprocedure-orientedandfacethegoaltendencydevelopment;thefour,informationprocessinghavedevelopedfromthevoicetothedataandtheimage;five,wirelessfrequencyspectrumprocessingalreadyfromnarrowbandsimulationtothenarrowbandCDMAdevelopment;thesix,computershavedevelopedfromcentralprocessingtothedistributionalserverandintellectualizedprocessing;theseven,semiconductordeviceshavedevelopedfromeachchip16,000,000,000,000/150MHzspeedVLSIto0.5/350MHzspeedVLSIand2,000,000,000,000,000/550MHzspeedVLSI.Underthistendency"sguidance,themobileservicerapiddevelopment,itsatisfiedthepeopleinanytime,anyplacetocarryonthecorrespondencewithanyindividualthedesire.Themobilecommunicationrealizesinthefuturetheidealperson-to-personcommunicationservicewaythatmustbetaken.Intheinformationsupporttechnology,themarketcompetitionandunderthedemandcombinedaction,themobilecommunicationtechnology"sdevelopmentisprogressesbyleapsandbounds,presentsthefollowingseveralgeneraltrends:1.networkservicedigitization,grouping;2.networkingwideband;3.networkingintellectualization;4.higherfrequencyband;5.moreeffectiveusefrequency;6.eachkindofnetworktendsthefusion.Theunderstanding,graspsthesetendencieshasthevitalpracticalsignificancetothemobilecommunicationoperatorandtheequipmentmanufacturer.38-- 重庆邮电大学移通学院本科毕业设计(论文)二、英文翻译现代移动通信在当今高度信息化的社会,信息和通信已成为现代社会的“命脉”。信息的交流主要依赖于计算机通信,而通信作为传输手段,与传感技术、计算机技术相互融合,已成为21世纪国际社会和世界经济发展的强大动力。为了适应时代的要求,新的一代移动通信技术应时而生,新的一代移动通信技术即人们称之第三代的核心特征是宽带寻址接入到固定网和众多不同通信系统间的无隙缝漫游,获取多媒体通信业务。随着时代的进步、科技的创新、人们的生活要求的提高,移动通信技术更新换代速度相当惊人,差不多每隔十年移动通信技术就发生一次变革性换代,从上个世纪80年代的“大哥大”到现在的3G手机,其间发生了两次移动通信技术的变革,从1G的AMPS过渡到2G的GSM,从GSM到IMT-2000(即3G技术)。就我所知现代的移动通信技术有以下几方面的重要技术:1.宽带调制和多址技术无线高速数据传输不能一味仅靠频谱的扩展,应在频谱效率上至少高于目前一个数量级,可在物理层采用三项技术,即OFDM、UWB和空时调制编码。OFDM与其他编码方式的结合,灵活把OFDM与TDMA、FDMA、CDMA、SDMA组合成多址技术。20世纪60年代OFDM的多路数据传输已成功用于Kineplex和Kathryn高频军事通信系统。OFDM已用于1.6Mbit/s高比特率数字用户线(HDSL),6Mbit/s不对称数字用户线(ADSL),100Mbit/s甚高速数字用户线(VDSL),数字音频广播和数字视频广播等。OFDM应用于5GHz上提供54Mbit/s无线本地网IEEE802.11a和IEEE802.11g,高性能本地域网络HiperLAN/2和ETSI-BRAN,还作为城域网IEEE802.16和集成业务数字广播(ISDB-T)标准。与单载频调制制式相比,OFDM调制制式要解决相对大的峰均功率比(PAPR,PeaktoAveragePowerRatio)和对频率位移和相位噪声敏感的问题。高速移动通信的另一要求是在宽噪声带宽下,所需解调信噪比应尽可能降低,从而增加覆盖面积。可采取抗衰落的快速发射功率控制和导频辅助快速跟踪相干解调技术,如频域抗衰落的Rake接收和跟踪技术,从时域和频域抵抗时间和频率选择性衰落的OFDMA技术,链路自适应技术,联合编码技术。38-- 重庆邮电大学移通学院本科毕业设计(论文)2.频谱利用率提升技术理论研究指出:在独立Rayleigh散射信道中,数据速率与天线数成线性关系,容量可达Shannon的90%。在发射和接收端以多天线开发信道空间可取得容量和频谱效率的增益。MIMO技术主要包括空间复用和空间分集技术,在独立信道上并发或连发相同信息来提高传输可靠性。收发双方的空间分集是高容量无线通信系统采用技术之一。贝尔实验室分层次空时的对角BLAST(D-BLAST)容量的增加为收发双方最小天线数的函数。利用MIMO所构成的跨时域和空域的扩展信号还可以抵抗多径干扰。V-BLAST系统在室内24~34dB时,频谱利用率为20~40bit/s/Hz。而发射和接收端均采用16天线,在30dB时,频谱利用率增至60~70bit/s/Hz。智能天线自动跟踪所需信号和自适应空时处理算法,利用天线阵产生空间定向波束,通过数字信号处理技术使主波束对准用户信号到达方向,旁瓣或零陷对准干扰信号到达方向。自适应阵列天线(AAA,AdaptiveArrayAntennas)中干扰抵消均衡器(ICE,InterferenceCancelingEqualizer)可减少干扰和降低发射功率。3.软件无线电技术软件无线电技术是在硬件平台上通过软件编辑以一个终端实施不同系统中多种通信业务。它用数字信号处理语言描述电信元件,以软件程序下载成数字信号处理硬件(DSPH,DigitalSignalProcessingHardware)。以具有通用开放无线结构(OWA,OpenWirelessArchitecture),兼容多种模式在多种技术标准之间无缝切换。UWB也称为脉冲无线电,调制采用脉冲宽度在纳秒级的快速上升和下降脉冲,脉冲覆盖的频谱从直流至吉赫兹,不需常规窄带调制所需的射频上变换,脉冲成型后可直接送至天线发射。4.软件无线电技术软件无线电技术是在硬件平台上通过软件编辑以一个终端实施不同系统中多种通信业务。它用数字信号处理语言描述电信元件,以软件程序下载成数字信号处理硬件(DSPH,DigitalSignalProcessingHardware)。以具有通用开放无线结构(OWA,OpenWirelessArchitecture),兼容多种模式在多种技术标准之间无缝切换。5.网络安全和QoS38-- 重庆邮电大学移通学院本科毕业设计(论文)QoS分为无线和有线侧两部分,无线侧的QoS涉及无线资源管理和调度,接纳控制和移动性管理等,移动性管理主要包括终端移动性,个人移动性和业务移动性。有线侧的QoS涉及基于IPdiffSer的区分业务和RSVP的端到端资源预留机制。把IPdiffer的IPQoS机制映射到无线侧。网络安全包括网络接入安全,核心网安全,应用安全,安全机制可见性与可配置性。在上述现代移动通信关键技术的基础上,产生了陆地蜂窝移动通信、卫星通信以及无线因特网通信技术,这些通信方式使通信面貌发生了巨大的变化,采用数字技术的现代无线通信已经渗入国民经济的各个领域和人们的日常生活,为此,我们需要关心它的发展趋势,希望它朝着越来越方便人们的生活的方向发展,现在就让我们来看看现代移动通信的未来发展趋势吧。现代移动通信技术发展的七个新趋势:一、移动管理已从终端管理向个人管理和智能管理发展;二、网络已从同步的数字电路向异步的数字分组和异步传递方式(ATM)发展;三、软件的开发已从算法驱动到面向过程和面向目标的趋势发展;四、信息处理已从话音发展到数据和图像;五、无线频谱的处理已从窄带模拟向窄带CDMA发展;六、计算机已从集中式处理发展到分布式服务器和智能化处理;七、半导体器件已从每芯片16兆门/150MHz速率的VLSI发展到0.5千兆门/350MHz速率的VLSI和2千兆门/550MHz速率的VLSI。在这种趋势的引导下,移动通信业务迅猛发展,它满足了人们在任何时间、任何地点与任何个人进行通信的愿望。移动通信是实现未来理想的个人通信服务的必由之路。在信息支撑技术、市场竞争和需求的共同作用下,移动通信技术的发展更是突飞猛进,呈现出以下几大趋势:1.网络业务数据化、分组化;2.网络技术宽带化;3.网络技术智能化;4.更高的频段;5.更有效利用频率;6.各种网络趋于融合。了解、掌握这些趋势对移动通信运营商和设备制造商均具有重要的现实意义。38--'