- 634.48 KB
- 2022-04-22 11:34:04 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
'《多媒体技术基础》第3版练习与思考题参考答案林福宗清华大学计算机科学与技术系2008-2-15linfz@mail.tsinghua.edu.cn第1章多媒体技术概要1.1多媒体是什么?多媒体是融合两种或者两种以上媒体的一种人-机交互式信息交流和传播媒体。使用的媒体包括文字、图形、图像、声音、动画和视像(video)。1.2超链接是什么?超链接(hyperlink)是两个对象或元素之间的定向逻辑链接,是一个对象指向另一个对象的指针。建立互相链接的这些对象不受空间位置的限制,可在同一个文件、在不同的文件或在世界上任何一台连网计算机上。1.3超文本是什么?超文本是包含指向其他文档或文档元素的指针的电子文档。与传统的文本文件相比,它们之间的主要差别是,传统文本是以线性方式组织的,而超文本是以非线性方式组织的。这种文本的组织方式与人们的思维方式和工作方式比较接近。1.4无损压缩是什么?无损压缩是用压缩后的数据进行重构(也称还原或解压缩),重构后的数据与原来的数据完全相同的数据压缩技术。无损压缩用于要求重构的数据与原始数据完全一致的应用,如磁盘文件压缩就是一个应用实例。根据当前的技术水平,无损压缩算法可把普通文件的数据压缩到原来的1/2~1/4。常用的无损压缩算法包括哈夫曼编码和LZW等算法。1.5有损压缩是什么?有损压缩是用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解的数据压缩技术。有损压缩适用于重构数据不一定非要和原始数据完全相同的应用。例如,图像、视像和声音数据就可采用有损压缩,因为它们包含的数据往往多于我们的视觉系统和听觉系统所能感受的信息,丢掉一些数据而不至于对图像、视像或声音所表达的意思产生误解。1.6SGML是什么语言?SGML语言的精华是什么?HTML是什么语言?HTML语言与SGML语言是什么关系?1
(1)1986年国际标准化组织(ISO)采用的信息管理标准。该标准定义独立于平台和应用的文本文档的格式、索引和链接信息,为用户提供一种类似于语法的机制,用来定义文档的结构和指示文档结构的标签。(2)SGML的精华是把文档的内容与样式分开处理。(3)HTML是用来创建超文本文档的标记语言,也是创建Web网页用的标记语言。(4)HTML是SGML的一个子集。1.7有人认为“因特网就是万维网”,这种看法对不对?为什么?(1)不对。(2)因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于TCP/IP协议的计算机网络;万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。1.8组成万维网的4个核心部分是什么?(1)超文本传输协议(HTTP);(2)文档格式标准,包括HTML,XML,XHTML;(3)执行HTTP协议的Web浏览器;(4)执行HTTP协议的Web服务器。1.9H.261~H.264和G.711~G.731是哪个组织制定的标准?国际电信联盟(ITU)。1.10MPEG-1,MPEG-2和MPEG-4是哪个组织制定的标准?ISO/IEC,即国际标准化组织(ISO)/国际电工技术委员会(IEC)。1.11因特网标准是哪个组织制定的标准?因特网标准是ISOC(因特网协会或称互联网协会)协调的4个组制定的。ISOC负责协调的4个组:(1)因特网工程特别工作组(IETF);(2)因特网体系结构研究部(IAB):(3)因特网工程指导组(IESG);(4)因特网研究特别工作组(IRTF)。1.12HTML和XML语言是哪个组织制定的标准?万维网协会(WorldWideWebConsortium,W3C)。1.13阐述你对数据、内容、信息、知识和智慧的理解。(1)数据(data)是以数字、字符或图像等可读语言或其他记录方法表示的事实、概念或指令,适用于人或自动装置进行通信、解释或处理。数据本身没有意义,通常需要在一定的语义环境中才有意义(2)内容(content)是对数据的描述,(3)信息(information)是对内容的解释,信息是数据的含义。(4)知识(knowledge)是在某个感兴趣领域中的事实、概念和关系。(5)智慧(wisdom)是知识累积后产生的洞察力、判断力和发明创造能力。2
第2章无损数据压缩2.1假设{,abc,}是由3个事件组成的集合,计算该集合的决策量。(分别用Sh,Nat和Hart作单位)。H0=(log23)Sh=1.580Sh=(loge3)Nat=1.098Nat=(log103)Hart=0.477Hart2.2现有一幅用256级灰度表示的图像,如果每级灰度出现的概率均为px()1/256i=,i=0,?,255,计算这幅图像数据的熵。n11HX()=−∑px()logii22px()=−256(××log)=8(位),i=1256256也就是每级灰度的代码就要用8比特,不能再少了。2.3现有8个待编码的符号mm0,,?7,它们的概率如练习_表2-1所示,计算这些符号的霍夫曼码并填入表中。答案不唯一)。练习表2-1待编码符号概率分配的代码代码长度(比特数)m00.411m10.20003m20.150013m30.100113m40.0701014m50.04010005m60.030100106m70.0101001162.4现有5个待编码的符号,它们的概率见练习表2-2。计算该符号集的:(1)熵;(2)霍夫曼码;(3)平均码长。练习表2-2符号a2a1a3a4a5概率0.40.20.20.10.1(1)熵nHa()ii=−∑pa()log()2pai=-0.4×log2(0.4)-2×0.2*log2(0.2)-2×0.1log2(0.1)i=1=0.4×1.3219+0.4×2.3219+0.2×3.3219=0.5288+-0.9288+0.6644=2.1220(位)(2)编码树和霍夫曼码3
a()0.420P4(1.0)a()0.2111a()0.21P3(0.6)30a()0.11P2(0.4)400P()10.2a()0.15练习图2-1编码树编码表符号概率霍夫曼码*码长所需位数a0.4010.42a0.21120.41a0.210130.63a0.1100140.44a0.1100040.45*代码分配不唯一(3)平均码长L=0.4+0.4+0.6+0.4+.04=2.2(位/符号)2.5使用算术编码生成字符串games的代码。字符g,a,m,e,s的概率见练习表2-3。练习表2-3符号games概率0.40.20.20.10.11.00.840.7920.77920.777761.0g0.6aa0.4mm0.2ee0.1ss0.00.60.760.7760.77760.7776练习图2-2games的算术码2.6字符流的输入如练习表2-4所示,使用LZW算法计算输出的码字流。如果对本章介绍的LZW算法不打算改进,并按表2-17所示步骤计算,请核对计算的输出码字流为:(1)(2)(4)(3)(5)(8)(1)(10)(11)…。练习表2-4输入位置1234567891011121314151617…4
输入字符流ababcbababaaaaaaa…输出码字ab-abc-bababa-aa--aaa练习表2-5步骤位置词典输出码字(1)a(2)b(3)c11(4)ab(1)22(5)ba(2)34(6)abc(4)45(7)cb(3)57(8)bab(5)610(9)baba(8)711(10)aa(1)813(11)aaa(10)916(12)aaa(11)……………2.7LZ78算法和LZ77算法的差别在哪里?(1)LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(2.4.2LZ77算法)。(2)LZ78的编码思想是不断地从字符流中提取新的缀-符串(String),通俗地理解为新“词条”,然后用“代号”也就是码字(Codeword)表示这个“词条”。这样一来,对字符流的编码就变成了用码字(Codeword)去替换字符流(Charstream),生成码字流(Codestream),从而达到压缩数据的目的。(2.4.4LZ78算法)2.8LZSS算法和LZ77算法的核心思想是什么?它们之间有什么差别?(1)LZSS通过输出真实字符解决了在窗口中出现没有匹配串的问题,但这个解决方案包含有冗余信息。(2.4.3LZSS算法)(2)LZ77编码算法的核心是查找从前向缓冲存储器开始的最长匹配串(2.4.2LZ77算法)2.9LZW算法和LZ78算法的核心思想是什么?它们之间有什么差别?(1)LZW算法和LZ78算法的核心思想都是不断地从字符流中提取新的缀-符串(String),通俗地理解为新“词条”,然后用“代号”也就是码字(Codeword)表示这个“词条”。这样一来,对字符流的编码就变成了用码字(Codeword)去替换字符流(Charstream),生成码字流(Codestream),从而达到压缩数据的目的。(2.4.4LZ78算法)(2)在编码原理上,LZW与LZ78相比有如下差别:①LZW只输出代表词典中的缀-符串(String)的码字(codeword)。这就意味在开始时词典不能是空的,它必须包含可能在字符流中出现的所有单个字符,即前缀根(Root)。②由于所有可能出现的单个字符都事先包含在词典中,每个编码步骤开始时都使用一字符前缀(one-characterprefix),因此在词典中搜索的第1个缀-符串有两个字符。③新前缀开始的字符是先前缀-符串(C)的最后一个字符,这样在重构词典时就不需要在码字流中加入额外的字符。(2.4.5LZW算法)5
2.10你是是否同意“某个事件的信息量就是某个事件的熵”的看法。“信息量(informationcontent)是具有确定概率事件的信息的定量度量”,而“熵(entropy)是事件的信息量的平均值,也称事件的平均信息量(meaninformationcontent)”。第3章数字声音编码3.1音频信号的频率范围大约多少?话音信号频率范围大约多少?(1)Audio:20~20000Hz(2)Speech:300~3400Hz3.2什么叫做模拟信号?什么叫做数字信号?(1)模拟信号是幅度或频率发生连续变化的一种信号。(2)数字信号是以二进制代码形式表示有无或高低的一种信号。3.3什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?(1)采样:在某些特定的时刻对模拟信号进行测量的过程。(2)量化:幅值连续的模拟信号转化成为幅值离散的数字信号的过程。(3)线性量化:在量化时,信号幅度的划分是等间隔的量化。(4)非线性量化:在量化时,信号幅度的划分是非等间隔的量化。3.4采样频率根据什么原则来确定?奈奎斯特理论和声音信号本身的最高频率。采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音。3.5样本精度为8位的信噪比等于多少分贝?48分贝3.6声音有哪几种等级?它们的频率范围分别是什么?表3-1声音质量和数据率采样频率样本精度单道声/数据率(kb/s)质量频率范围(kHz)(bit/s)立体声(未压缩)电话*88单道声64.0200~3400HzAM11.0258单道声88.220~15000HzFM22.05016立体声705.650~7000HzCD44.116立体声1411.220~20000HzDAT4816立体声1536.020~20000Hz3.7选择采样频率为22.050kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=1024×1024B)(22050×2×2×2×60)/(1024×1024)=10.09MB3.8什么叫做均匀量化?什么叫做非均匀量化?6
(1)均匀量化:采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。(2)非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如,对大的输入信号采用大的量化间隔,对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。3.9什么叫做μ率压扩?什么叫做A率压扩?(1)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在北美PCM电话网中,使用μ率压扩算法。(2)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在欧洲电话网,使用A律压扩算法。对于采样频率为8kHz,样本精度为13比特、14比特或16比特的输入信号,使用μ律压扩编码或使用A律压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64kbps。3.10G.711标准定义的输出数据率是多少?T1的数据率是多少?T2的数据率是多少?(1)G.711使用μ率和A率压缩算法,信号带宽为3.4kHz,压缩后的数据率为64kbps。(2)T1总传输率:1.544Mbps。(2)T2总传输率:6.312Mbps。3.11自适应脉冲编码调制(APCM)的基本思想是什么?根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。3.12差分脉冲编码调制(DPCM)的基本思想是什么?利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值,这就降低了传送或存储的数据量。此外,它还能适应大范围变化的输入信号。3.13自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么?ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。第4章彩色数字图像基础4.1什么叫做真彩色和伪彩色?在一幅彩色图像中,每个像素值有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。例如用RGB5∶5∶5表示的彩色图像,R,7
G,B各用5位,用R,G,B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色。现在,通常把每个像素的颜色值用24位表示的颜色叫做真彩色。24位表示24的颜色总数:2=16777216种颜色。4.2什么叫做屏幕分辩率和图像分辩率?查看你使用的计算机的所有屏幕分辩率。(1)屏幕分辩率是显示设备再现图像的精细程度的度量方法;图像分辨率是图像精细程度的度量方法。(2)在Windows的主界面下,单击鼠标器的右键→在弹出的菜单上点击“属性”→在弹出的“显示属性”窗口上点击“设置”按钮→然后点击“高级”按钮→在弹出的“默认监视器和…”窗口上点击“适配器”按钮→再点击“列出所有模式(L)…”按钮,就可看到你的计算机的所有屏幕分辩率。4.3一个像素的RGB分量分别用3,3,2位表示的图像,该幅图像的颜色数目最多是多少?如果有一幅256色的图像,问该图的颜色深度是多少?(1)256种;(2)8位4.4按照JPEG标准的要求,一幅彩色图像经过JPEG压缩后还原得到的图像与原始图像相比较,非图像专家难以找出它们之间的区别,此时的最大压缩比是多少?24:14.5JPEG压缩编码算法的主要计算步骤是:①DCT变换,②量化,③Z字形编码,④使用DPCM对直流系数(DC)进行编码,⑤使用RLE对交流系数(AC)进行编码,⑥熵编码。假设计算机的精度足够高,在上述计算方法中,哪些计算对图像的质量是有损的?哪些计算对图像的质量是无损的?算法名称有损/无损算法名称有损/无损①DCT变换无损④使用DPCM对直流系数(DC)进行编码无损②量化有损⑤使用RLE对交流系数(AC)进行编码无损③Z字形编码无损⑥熵编码无损4.6什么叫做γ校正?在屏幕上显示用离散量表示的色彩时采用的一种色彩调整技术。计算机显示器和电视采用的阴极射线管产生的光亮度与输入的电压不成正比,而是等于以某个常数为底,以输入电压为指数的数,这个常数称为γ,它的值随显示器的不同而改变,一般在2.5左右。4.7什么叫做α通道?它的作用是什么?在每个像素用32位表示的图像表示法中的高8位,用于表示像素在一个对象中的透明度。例如,用两幅图A和B混合成一幅新图New,新图的像素为:Newpixel=(alpha)(pixelAcolor)+(alpha)(pixelBcolor)。在计算机环境下,α通道可存储在帧缓冲存储器中的附加位平面上。对于32位帧缓冲存储器,除高8位是α通道外,其余24位是颜色位,红、绿和蓝各占8位。4.8PNG图像文件格式的主要特点是什么?PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的α通道数据。详见“4.7.4PNG格式”。8
4.9什么叫做图形(graphics)、图像(image)、位图(bitmap)和图形图像(graphicalimage)?(1)图形:按照数学规则用绘图软件(如AdobeIllustrator)或图形输入设备创建的图,如工程图和结构图。(2)图像:用像素值阵列表示的人物或场景的图。(3)位图:用像素值阵列表示的图。(4)图形图像:表示矢量图的位图。4.10通过调查、试验和分析,把BMP,GIF,JPG和PNG格式的一些特性填入下表。图像文件格式名称BMPGIFJPGPNG有损还是无损压缩无损无损有损无损支持的最大颜色数167772162561677721616777216第5章颜色的度量体系5.1在开拓颜色科学方面,Newton,ThomasYoung,Maxwell,Munsell,Ostwald和CIE分别做出了哪些重要贡献?(1)Newton:发明了颜色圆,用于度量颜色(2)Thomas:认为人的眼睛有三种不同类型的颜色感知接收器,大体上相当于红、绿和蓝三种基色的接收器。(3)Maxwell:探索了三种基色的关系,并且认识到三种基色相加产生的色调不能覆盖整个感知色调的色域,而使用相减混色产生的色调却可以。他认识到彩色表面的色调和饱和度对眼睛的敏感度比明度低。Maxwell的工作可被认为是现代色度学的基础。(4)Munsell:开发了第一个广泛被接受的颜色次序制,称为Munsellcolor-ordersystem或者叫Munsellcolorsystem,对颜色作了精确的描述并用在他的教学中。Munsell颜色次序制也是其他颜色体系的基础。(5)Ostwald:开发了Ostwald颜色体系,根据对颜色起决定作用的波长、纯度和亮度来映射色调、饱和度和明度的值。(6)CIE定义了许多度量颜色的标准5.2什么是颜色空间?对人、显示设备和打印设备,通常采用什么颜色参数来定义颜色?(1)颜色空间:表示颜色的一种数学方法,人们用它来指定和产生颜色,使颜色形象化。(2)对于人来说,可以通过色调、饱和度和明度来定义颜色;对于显示设备来说,人们使用红、绿和蓝磷光体的发光量来描述颜色;对于打印或者印刷设备来说,人们使用青色、品红色、黄色和黑色的反射和吸收来产生指定的颜色。5.3什么叫做颜色系统(即颜色体系)?简要说明组织和表示颜色的两种方法。(1)组织和表示颜色的方法。(2)两种方法:颜色模型(colormodel),编目系统(catalogingsystem)。注:(1)颜色模型:在台式机排版和图形艺术中,表示颜色的任何一种方法或约定。在图形艺术和印刷领域,颜色常用Pantone(公司)颜色匹配系统;在计算机图形学方面,以下任何一种不同的色彩系统都可以描述色彩:HSB(色调,饱和度和亮度),CMY(青,品红,黄)和RGB(红,绿,蓝)。(2)颜色空间是颜色模型最普通的例子,RGB,HSB,CMY,CIEXYZ,CIELAB,CMYK和颜色的光谱描述方法都是颜色模型。9
5.4使用你能够找到的工具和资料,探讨本章介绍的CIE度量体系是否有错误,哪些地方需要修改和补充。CIE度量体系包括:①CIE1931RGB②CIE1931XYZ③CIE1931xyY④CIE1960YUV和CIEYU"V"⑤CIE1976LUV⑥CIE1976LAB⑦CIELUVLCh和⑧CIELABLCh(略)第6章颜色空间变换6.1PAL制彩色电视使用什么颜色模型?NTSC制彩色电视使用什么颜色模型?计算机图像显示使用什么颜色模型?(1)PAL制彩色电视:YUV(2)NTSC制彩色电视:YIQ(3)计算机图像显示设备:RGB6.2用YUV或YIQ模型来表示彩色图像的优点是什么?为什么黑白电视机可看彩色电视图像?(1)YUV表示法的优点:①它的亮度信号(Y)和色度信号(U,V)是相互独立的,因此可以对这些单色图分别进行编码;②可以利用人眼的特性来降低数字彩色图像所需要的存储容量。YIQ同样具有YUV的这两个优点。(2)黑白电视能接收彩色电视信号的道理是利用了YUV/YIQ分量之间的独立性。6.3在RGB颜色空间中,当R=G=B,且为任意数值,问计算机显示器显示的颜色是什么颜色?灰色6.4在HSL颜色空间中,当H为任意值,S=L=0时,R,G和B的值是多少?当H=0,S=1,L=0.5,R,G和B的值是多少?(1)当H为任意值,S=L=0时,R=G=B=0(2)当H=0,S=1,L=0.5时,R=1,G=B=06.5打开Windows操作系统中的“画图”程序,在“编辑颜色”窗口中的红(R)、绿(G)、蓝(B)和色调(H)、饱和度(S)、亮度(L)对应显示上,如果设置R=G=B=255,问H,S和L的值分别为多少?分别改变R,G和B的值,观察H,S和L的值的变化。当R=G=B=255时,H=160,S=0,L=240。(2)(略)6.6用MATLAB编写RGB到HSL和HSL到RGB颜色空间的转换程序:rgb2hsl.m和hsl2rgb.m。(略)6.7用MATLAB编写Y"CbCr和R"G"B"[0,219]颜色空间的转换程序:RGB2YCbCr和YCbCr2RGB.m。(略)第7章小波与小波变换7.1写出矢量空间W3的哈尔小波并画出它的波形。10
⎧≤10xx<1/16⎧12/16≤<3/1633⎪⎪ψψ()xx=−⎨⎨11/16≤<2/16()xx=−13/16≤<4/1601⎪⎪⎩00其他⎩其他⎧≤14/16xx<5/16⎧16/16≤<7/1633⎪⎪ψψ()xxxx=−⎨⎨15/16≤<6/16()=−17/16≤<8/1623⎪⎪⎩00其他⎩其他⎧≤18/16≤