{dy}章 市场上主要有3种手写板:电阻压力板、电磁感应板和电容触控板。电阻压力板是早期手写板采用的技术,由于其原理简单,工艺不复杂,成本较低,价格便宜。由于它是通过感应材料的变形来工作的,材料容易疲劳,使用寿命较短。 图像扫描仪主要性能指标1)分辨率:以每英寸上扫描象素点数(DPI)表示,通常在300DPI到1200DPI之间。2)灰度,指图像亮度层次范围,目前可达250 3)色彩度,指彩色扫描仪支持的色彩范围,用象素的数据位表示,如24位支持16M色。 4)速度,在指定的分辨率和图像尺寸下的扫描时间。 5)幅面:支持的幅面大小,如A4、A3 扫描仪按幅面大小可分为台式扫描仪和手持式扫描仪。按图像类型分为灰度扫描仪和彩色扫描仪。 触摸屏 一般由两部分组成:触摸屏控制卡和触摸检测装置。按介质及工作原理,可分为电阻式、电容式、红外线式和声表面波式。 视频捕获卡是把输入的模拟视频信号,通过内置芯片提供的捕捉功能转换成为数字信号的设备,一般以内置的PCI插卡为主。昂贵的视频捕捉卡带有视频压缩功能。 CRT由德国人布劳恩发明,也称为布劳恩管。 LCD是一种低电压、低功耗器件。优点是平面型,结构简单,显示面也可以任意加工制作,使用寿命较长。它是反射型的,在室内条件下也容易观看。没有辐射,不伤人体,画面不会闪烁,可以保护眼睛。可悬挂于墙上。 分子具有方向性的液体则称为液态晶体,简称为液晶。液晶显示器是一种液晶利用光调制的受光型显示器件。 等离子显示器(PDP)又称为电浆显示器,为{zx1}一代显示器,其特点是厚度极薄、分辨率高,占用极少的空间。优点:可以制作出超大尺寸的平面显示器;与阴极射线管不同,它没有弯曲的视觉平面,视角扩大到160度以上;等离子显示器的分辨率等于甚至超过传统的显示器,所显示图像的色彩也更亮丽、更鲜艳 背投是相对于正投来说的,背投和正投的原理是一样的。正投是观察者和摄投影机位于反射屏幕的同一侧,观察者看到的是屏幕反射回来的光;背投是观察者和投影机位于屏幕的两侧,从投影机投射出来的光照射到半透明的背投屏幕时会有部分光透过,观察者看到的是投射出来的光。 显卡的主要作用是对图形函数进行加速。图形加速卡拥有自己的图形函数加速器和显存,这些都是专门用来执行图形加速任务的,因此可以大大减少CPU所需处理的图形函数。 通常所说的加速卡的性能,是指加速卡上的芯片集能够提供的图形函数计算能力,这个芯片集通常也称为加速器。 打印机分为击打式和非击打式,击打式以点阵式打印机为主,非击打式以激光打印机和喷墨打印机为主。 击打式打印机可同时多层打印,是该类打印机独有的。 激光打印机的图形功能和字体变化功能方面是其他打印机无法替代的。 调制解调器modem的作用是利用模拟信号传输线路传输数字信号。电子信号可分为模拟信号和数字信号。 传统的调制解调器已经逐渐被ADSL调制解调器所取代。 ADSL采用复杂的数字信号处理技术和新的数据压缩算法,使大量的信息得以在网络上高速传输。 网卡(NIC,network interface card),它的主要工作原理是整理计算机上发往网线上的数据,并将数据分解为适当大小的数据包在网络上发送出去。每个网卡有惟一的网络节点地址。
USB设备
通用串行总线,主要特点:即插即用、可热插拔,并具有自动配置能力。1.1版12Mb/s,2.0版480Mb/s。USB采用四线电缆,其中两根是用来传递数据的串行通道,另两根为下游设备提供电源。
USB支持4种基本的数据传输模式:控制传输、等时传输、中断传输及数据块传输。
USB设备具有以下几个方面的优点:使用方便,速度快,连接灵活,独立供电,支持多媒体,低成本。
USB设备硬件结构:USB采用级联星型拓扑,该拓扑由3个部分组成:主机,集线器,功能设备。
USB软件结构:1.USB总线接口。2.USB系统。
USB最多可支持5个非hub层以及127个外设。
数码产品分为数码影像类、数码随身听和掌上电脑三大类。
第三章 数字图像处理技术
图像通常包括动态图像和静态图像。动态图像包括动画和视频信息,是连续渐变的静态图像或图形的序列,沿时间轴顺次更换显示,从而构成运动视感的媒体。
美国信息论专家香农{dy}次提出数字化信息的基本单位——比特。
信号的数字化处理包括两个步骤:一是时间上的离散化,即采样;二是幅度上的离散化,即量化。数字化后的信号,将全部变为0和1的序列,这使得信息的采集、存储、传输、复制、加工变得很方便。
采样也叫抽样,是信号在时间上的离散化。量化是对幅值进行离散化。
采样长度就是采样时间的长度。
色彩可用色调、饱和度、亮度来描述。其中色调与光波的波长有直接关系,亮度和饱和度与光波的幅度有关系,色调由物体表明反射的光线中什么波长占优势决定。
黄色的亮度{zg}。
饱和度是指颜色色调的表现程度,某种色调越接近白色或灰色,它的饱和度越小。在饱和的彩色光中增加白光,相当于增加了光能,因而变得更亮了,但是它的饱和度却降低了。
RGB色彩可分为真彩色、伪彩色、调配色。
真彩色是指图像中的每个像素都分为R、G、B三个基本分量,每个基色分量都直接决定其基色的强度,这样产生的色彩称为真彩色。
伪彩色图像的每个像素值实际上是一个索引值或者代码,该代码作为色彩查找表中某一项的入口地址。调配色的获取是通过每个像素占的R、G、B分量分别作为单独的索引值进行变换。
调配色的效果比一般伪彩色要好。
Lab:是由RGB转为HSB或CMYK模式的桥梁,发光率、颜色A、B。
HSB颜色模式指色调、饱和度、亮度。
CMYK是彩色印刷使用的一种颜色模式。
YUV电视系统常用模式,由一个亮度信号Y和两个色差信号U、V组成。
能够对多媒体数据进行压缩的前提是因为数据存在大量的冗余,数据压缩的目的就是尽可能地xx这些冗余。
冗余分为以下几类:1)统计冗余:大量统计特征上的重复
2)信息熵冗余:信息熵定义为一组数据所表示的信息量,等于各记录码元的二进制位数(即编码长度)与该码元出现的概率乘积之和 3)结构冗余:图像纹理
4)知识冗余:
5)视觉冗余:人的视觉对某些细节不敏感
数据压缩的目的是便于存储和运输,为了对数据进行还原,必须进行解压缩,因此数据压缩通常包括对数据的编码和解码。
解码的运算复杂度低于编码。
评价压缩算法的指标:压缩比,算法的复杂度和运算速度,失真度。
行程长度编码
RLE,又称游程编码,就是把一系列的重复值用一个单独的值加上一个计数值来取代。
哈夫曼编码:
步骤:1.统计信源符号出现的概论。
2.将信源符号按概率递减顺序排列。
3.把两个最小的概率值加起来,作为一个新组合符号的概率。
4.重复(2)和(3)的操作,直到概率和达到1。
5.在每次合并信源时,将合并的信源分别标记为1和0。(比如概率小的标为1,概率大的标为0。)
6.寻找从每一信源符号到概率为1的路径,记录下路径下的1和0。
7.对每一符号写出1和0序列。
缺点:
1)必须xx统计出每个值出现的频率,通常需要两遍操作,速度慢。
2)译码过程比较复杂,对于位的增删比较敏感。
词典编码属于无损压缩技术。
预测编码可分为线性预测和非线性预测编码。前者常被称为差分脉冲编码调制,即DPCM,其基本原理是基于图像中相邻象素之间的相关性,每个象素可通过与之相关的几个象素来进行预测。可以获得比较高的编码质量,并且实现起来比较简单,因此被广泛地应用于图像压缩编码系统。但是它的压缩比不高,而且xx的预测有赖于大量的先验知识,并且必须进行大量的非线性运算,一般不单独使用,而是与其他方法结合使用。
矢量图是用数学方法描述的一系列点、线、弧和其他几何形状,存放这种图使用的格式称为矢量图格式。
位映像图也叫光栅图,这种图由像素组成。
矢量图与位图相比:位图文件要比矢量图文件显示的快;矢量图侧重于绘制,而位图偏重于获取、复制。矢量图和位图之间可以用软件进行转换。
影响位图大小的因素主要有:图像分辨率和像素深度。
矢量图的大小则主要取决于图的复杂程度。
BMP文件由3部分组成:位图文件头数据结构,位图信息数据结构和位图阵列。
GIF定义了允许用户设置背景为透明的属性,GIF格式可在一个文件中存放多幅彩色图形图像,它们可以像演幻灯片那样显示或者像动画那样显示,使用LZW压缩算法来存储。
TIF格式
TIFF格式,与硬件无关,可以用几种不同的压缩方法压缩。文件组成:文件头、参数指针表、参数数据表。
PNG文件格式其目的是代替GIF和TIFF格式,同时增加了一些GIF不具备的特性。PNG使用无损数据压缩算法。
PNG的优点:兼有GIF和JPEG的色彩模式;PNG能把图像文件压缩到极限以利于网络传输,但又能保留所有与图像品质有关信息的解决方案;更优化的传输显示;透明图像在制作网页图像的时候很有用;GIF图像在不同系统上所显示的画面也不会一样,PNG却可以使图像在所有系统上的显示图像xx相同。
PNG的缺点:㈠GIF可以存储多张GIF图像到一个文档中,从而做出动画效果。PNG则不支持动画应用。㈡PNG采用的是无损压缩方式,尽管相同质量的PNG图像文件比JPEG的要小,但是JPEG可以适当地牺牲画面质量而取得比PNG更小的尺寸。㈢PNG不支持CMYK的模式。
JPEG标准规定了两种工作方式:顺序方式和渐进方式。
JPEG属于有损压缩方式。
JPEG基本系统编码过程(重点掌握)
1)二维DCT正变换,减少图像数据的相关性
2)系数量化,根据压缩精度将变换系数用较少的比特数表示
3)编码模型与统计事件,压缩系数矩阵中的零数据,从量化后的系数矩阵生成供熵编码的统计事件。直流分量使用DPCM编码。
4)熵编码:基本系统中用哈夫曼编码,扩展系统中可用算术编码。
5)数据结构,增加一些附加信息
JPEG的压缩效果
0.15b/p,可识别,0.25有用,0.75{jj0},1.5时基本与原图无区别。
JPEG2000放弃了JPEG所采用的以离散余弦变换算法为主的区块编码方式,而改用以离散小波变换算法为主的多解析编码方式。
JPEG2000与JPEG相比的优势:高压缩率;同时支持有损压缩和无损压缩;渐进传输;感兴趣区域压缩。
Mpeg算法面临的问题:仅靠帧内编码无法到达在保证画面质量前提下的高压缩比。
为满足高压缩比和随机访问的要求,mpeg采取了预测和插值两种帧间编码技术。
MPEG-1视频压缩算法(重点掌握)
系统参数:图像宽度、高度、象素长宽比、帧速率、位速率、缓冲区尺寸等。
算法的两个基础:基于16X16块的运动补偿缩减时间冗余,基于变换域(DCT)的缩减空间冗余技术。
1)缩减时间冗余度:3种画面:内帧(I)、预测帧(P)和内插帧(B)。内帧经过中度压缩,可作为随机访问点,预测帧以参考帧(I或P)为基础进行编码,它又是后面预测帧的参考帧。内插帧压缩比{zg},它需要前后两参考帧,但它本身不能作为参考帧使用。MPEG选择16X16宏块作为运动补偿单元。每8个画面有一个内帧:IBBBPBBBI。
2)缩减空间冗余度:类似于JPEG,三个阶段:{dy}阶段基于DCT的正交变换,计算变换系数,第二阶段对变换系数进行量化,将数据按Z字形扫描顺序重新组合,{zh1}对变换系数按行程编码进行熵编码,以达到进一步压缩的目的。
MPEG考虑3种画面:内帧(I)、预测帧(P)、内插帧(B)。这样做的重要性:一是考虑随机访问视频存储的重要性,二是运动补偿插值可显著降低位速率。
运动补偿预测是应用最广泛的减少时间冗余的方法。
MPEG一个重要特色就是采用了运动补偿插值技术,它可以改善随机访问性能,提高视频的图像质量。
MPEG减少空间冗余方法:混合使用变换编码、基于视觉加权的标量量化 、行程编码等技术。
MPEG—4主要应用于可视电话、视频邮件和电子新闻等,对传输速率要求低,利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最小的数据获得{zj0}的图像质量。
MPEG—4的主要特征:基于内容的压缩,更高的压缩比,时空可伸缩性。
H.261是CCITT制定的国际上{dy}个视频压缩标准,主要用于电视电话和会议电视。
H.263是用现在的电话网传输活动图像。
H.263提供两种编码模式:帧内编码、帧间编码。
QCIF图像的帧结构,从上到下为:图像帧,块组,宏块,块。
第四章 音频信号和声卡
声音根据其内容可以分为波形声音、语音和音乐。波形声音是数字化了的声音。计算机处理的声音信号是经过离散化了的信号,因此通常又称为音频信号。
声音的连续性表现在:一是时间上的连续性,二是幅度上的连续性。
声音分为规则声音和不规则声音:不规则声音指不包含任何信息的噪声。规则声音又分为语音、音乐和音效。多媒体技术主要研究的是规则声音中的语音和音乐信号。
声音有三个要素即音调、音强、音色。
带宽越宽,音质也越好。人的听觉器官能感知的频率范围为20HZ——20000HZ。
当声音弱到人的耳朵刚刚可以听到时,我们称此时的声音强度为“听阈”。
当声音强到使人耳朵感到疼痛,这个阈值称为“痛阈”。
在听阈和痛阈之间的区域就是人耳的听觉范围。
为了使计算机能够进行处理必须首先对声音在时间轴和幅度两个方面进行离散化。
常见音频文件格式
wav、au、aiff、snd、rm、mp3等。wav称为波形文件格式,是一种资源交换文件格式(RIFF)。
声音质量
客观质量主要用信噪比SNR。主观质量常用的有平均意见得分(MOS)。数据语音通信中,分为:广播质量、网络质量、通信质量和合成质量。
以WAV为扩展名的文件格式称为波形文件格式。
AVI是audio video interleaved(音频视频交错)的英文缩写,它是microsoft公司开发的一种数字音频和视频文件格式。但AVI并未限定压缩标准,用不同的压缩算法生出的AVI文件,必须使用相应的压缩算法才能播放出来。
RM文件是由realnetworks公司开发的一种新型流式视频文件格式,用来在低速网络上实时传输活动视频图像。
数字化的音频信号必须经过编码处理,以适应存储和传输的要求。
脉冲编码调制(PCM):脉冲编码调制是概念上最简单、理论上xxx的编码系统,但也是数据量{zd0}的编码系统。
声音数字化有两个步骤:{dy}步是采样,就是每隔一段时间间隔读一次声音的幅度;第二步是量化,就是把采样得到的声音信号幅度转换成数字值。
量化有两种:一类是均匀量化,即线性量化,如果采用相等的量化间隔对采样得到的信号进行量化;一类是非均匀量化,即非线性量化,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔。
增量调制(DM)是一种预测编码技术,由于DM编码的这种简单性,它已成为数字通信和压缩存储的一种重要方法。
增量调制虽然简单,但存在两个缺点:一是会出现斜率过载,二是会产生粒状噪声。在开始阶段,增量调制器的输出不能保持跟踪输入信号的快速变化,这种现象称为增量调制器的“斜率过载”;粒状噪声是指在输入信号缓慢变化的部分,即输入信号与预测信号的差值接近零的区域,增量调制器的输出会出现随机交变的“0”和“1”。
为了解决这个矛盾,人们就提出了自适应增量调制(ADM)方法,这种方法的特点是使增量调制器的量化能随信号自动调整。
自适应脉冲编码调制(APCM)是根据输入信号幅度的均匀根值的变化来改变量化增量的一种编码技术。
差分脉冲编码调制(DPCM)是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。基本思想:根据过去的样本去估算下一个样本信号的幅度的大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而减少了表示每个样本信号的位数。
自适应差分脉冲编码调制:综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。思想:⒈利用自适应的思想改变量化增量的大小,即使用小的量化增量去编码小的差值,使用大的量化增量去编码大的差值⒉使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
MP3是MPEG audio layer3 音频文件的缩写,它是一种超级声音文件的压缩方法,具有文件小,音质佳的特点。MPEG是由音频和视频两部分组成的。
在MPEG音频编码模式中,MP3功能最强大;在同样的音质条件下,MP3需要的数据量最小;在同样的数据量条件下,MP3音质{zh0}。
MP3对音频信号采用的是有损压缩的方法,虽然它是一种有损压缩的方法,但它以极小的是真换来较高的压缩比。
乐器数字接口MIDI
MIDI是乐器数字接口的英文缩写,是数字音乐/电子合成乐器的统一国际标准。
声卡可分为PCI声卡和USB声卡。
声卡所支持的声道数是反映声卡技术发展的一个标志。
单声道:我们可以明显的感觉到声音是从两个音箱的中间传递到我们的耳朵里的。
立体声:声音在录制过程中被分配到两个独立的声道,从而达到了很好的声音定位效果。
四声道环绕规定了4个发音点:前左、前右、后左、后右,听众则被包围在中间,同时还可以增加一个低音音箱,以加强对低频信号的回放处理。
声卡的功能:⒈录制、编辑和回放数字声音文件。⒉控制各声源的音量,并混合在一起,以便数字化。⒊在记录和回放数字文件时进行压缩和解压缩,以节省存储空间。⒋采用语音合成技术,能让计算机朗读文件。⒌MIDI接口。
声卡的工作原理:主机通过总线将数字化的声音信号以PCM的方式送到数模转换器(D/A),将数字信号变成模拟的音频信号。同时又可以通过模数转换器(A/D)将麦克风或CD的输入信号转换成数字信号,送到计算机进行处理。
在数字音频信息获取与处理过程中,顺序为:采样,A/D转换,压缩、存储,解压缩,D/A转换。
让人与计算机自由地交谈,机器能够听懂人讲话,是语音识别技术最终实现的目标。
语音识别技术主要包括特征提取技术,模式 |