计算机基础(03)多媒体应用基础

您所在的位置:网站首页 多媒体技术主要包括什么技术 计算机基础(03)多媒体应用基础

计算机基础(03)多媒体应用基础

2024-07-14 00:51| 来源: 网络整理| 查看: 265

3 多媒体应用基础 3.1 多媒体技术概述 3.1.1 多媒体基础概念

@1 媒体与多媒体:从一般意义上讲,在计算机或通讯领域,媒体是指信息的载体或者信息的存储实体

信息载体:数字、文字、声音、图形、图像、视频,信息的存储实体包括磁盘、磁带、光盘、U盘等。而就多媒体计算机而言媒体:指信息载体,根据国际电信联盟的定义,媒体可分为5种:感觉媒体:作用于人的感觉器官,使人产生直接直接的媒体,如声音、图像表示媒体:加工、处理、传输感觉媒体,如语言编码显示媒体:电信号与感觉媒体之间转换,指输入输出设备存储媒体:存储信息的介质,如硬盘、光盘传输媒体:承载与传输信息,如同轴电缆多媒体:通常就是文字、声音、图像、图形、动画、视频等各种媒体在计算机统一管理下的有机结合

@2 多媒体计算机技术:计算机综合处理多种媒体信息(文本、图形、图像、音频、视频、动画),使多种信息建立逻辑连接,集成为一个系统且具有交互性

@3 多媒体信息的主要元素:

文本:包含字母、数字、汉字等基本元素图形:又称矢量图图像:又称位图或像素图动画:采用编程或动画软件创作的连续画面音频:指人耳能听到的连续变化的音波视频:动态的影视图像

@4 多媒体的技术特征:

集成性:设备集成,与计算机形成整体;多媒体信息的有效集成,一体化交互性:人工可以干预媒体播放的次序和内容,通过人机交互实现实时性:处理信息有严格的实时要求和速度要求数字化:最终存储媒体信息只能是0和1,处理过程即为数字化多样性:多媒体不只处理一种媒体

@5 多媒体涉及的关键技术,包括:

因频视频信号的获取技术多媒体数据的压缩编码和解码技术音频视频数据的实时处理和特技音频视频数据的输出技术

@6 多媒体数据的特点:数据量大、数据类型多、数据类型差别大、输入输出复杂

3.1.2 多媒体技术的应用与发展

@1 多媒体应用:网络、工业应用、医疗诊断

@2 多媒体技术的发展历史:

1984年,Apple公司推出Machintosh图形操作系统。1985年,世界上第一台多媒体计算机问世。1986年,推出光盘系统。1990年,多媒体个人计算机协会制定MPC1标准。1995年,Windows95操作系统问世

@3 多媒体的发展与现状:

CAI远程教育系统:通过网络改变传统教育理念,指多媒体信息教学语音识别:让计算机听懂人的语言视频点播(VOD):按照用户要求播放节目的视频点播系统多媒体著作工具:多媒体编辑软件多媒体技术智能化:把人工智能领域某些研究课题与多媒体计算机技术结合多媒体信息实时处理和压缩编码算法芯片化:把多媒体信息实时处理和压缩编码算法直接放置到CPU芯片中,改善多媒体计算机的性能指标虚拟现实技术:运用多种技术综合形成一种模拟现实环境的人造环境,用户在该环境中通过五官和大脑的亲自体验并参与到该虚拟环境中可以与之交互,让用户感觉到如同置身于真实世界一样,它是多媒体技术的最高境界 3.1.3 多媒体系统的组成

@1 多媒体层次结构:将音频和视频与计算机集成在一起的有机整体,一个多媒体系统,可以分为6个层次,如下所示:

@2 多媒体的层次结构图如下所示:

@3 多媒体计算机硬件系统:

主机:可以是中大型机、工作站、个人PC多媒体接口卡:声卡、显卡、视频压缩卡、视频捕捉卡、视频播放卡、通信卡等多媒体外部设备: 多媒体输入设备:摄像机、录像机、扫描仪、传真机、数码相机、话筒等多媒体输出设备:电视机、投影电视、音响多媒体人机交互设备:键盘、鼠标、触摸板、光笔存储设备:光盘、磁盘扩展设备简介:触摸屏、视频卡、扫描仪、数码相机、数字摄像机、各种彩色打印机、彩色投影仪等。 触摸屏:属于输入设备,可通过手指直接触及屏幕上的菜单、光标、接钮等;主要由传感器、控制部件、驱动程序组成,当用手指或其它设备触摸显示器前面的触摸屏时,所摸到的位置以坐标形式被触摸屏控制器检测到,并通过接口送到CPU,从而确定用户所输入的信息 视频卡:插在主机板的扩展槽内,可以对视频信号进行数字化转换、编辑和处理,以及保存数字化文件;通常使用的视频采集卡可接收模拟视频源的信号(如录像机、电视机、LD影碟机等),并对该类信号进行数字化处理,然后再压缩编码成数字视频信号;此外,还有一种比较流行的视频采集卡,我们称之为IEEE1394数字视频采集卡。它主要的作用是将数码摄像机中存放在数码摄像带上的视频数据传送到电脑硬盘中,和模拟采集不同的是它在传送数据的过程中没有任何质量损失扫描仪:图形输入设备。配合适当的应用软件后,扫描仪还可以进行中、英文智能识别;扫描仪工作原理:把原件面朝下放在扫描仪的玻璃台上,扫描仪内发出光照射原件,反射光线经光学镜面导向后,照射到CCD的光敏器件上。CCD将不同颜色光的强度转换成等价的电信号,再送到模数转换器中转换成代表每个像素色调或颜色的数字值。步进电机驱动扫描头沿平台作微增量运动,每移动一步,即获得一行像素值。数码照相机:采用CCD作为记录图像的介质,CCD实际上是一块布满光敏元件的感光板, 它通过光照的不同引起的电荷分布的不同来记录被摄入的物体,几个技术指标(简介):

CCD和像素:CCD上感光元件越多则像素就越多,像素越多则图像越清晰。

对焦:对焦,是指将透过镜头折射后的影像准确投射到CCD感光板上,形成清晰的影像

存储卡:数码相机摄入的像片直接存储在相机存储卡中。

@4 多媒体计算机软件系统:将多媒体硬件有机结合在一起,灵活调节多媒体数据,主要分:

多媒体设备驱动程序:用于在启动操作系统时把设备的状态、型号、工作模式等信息提供给操作系统,并驻留在内存中供系统调用多媒体产品制作软件:主要包括图像、视频、音频的编辑制作多媒体平台软件:用于多媒体素材的组合工具软件:用于加工和处理数据,如压缩、加密等应用软件:Windows系统提供的多媒体软件、动画播放软件、声音播放软件、光盘刻录软件等 3.2 数字声音 多媒体主要处理音频信号,对于超声波和亚声波不作处理 3.2.1 声音基本概念与声音数字化

数字音频基本概念:

声音:一种机械振动;模拟音频技术把这种机械振动转换成电信号,并以模拟电压表示声音强弱模拟音频信号:声音波形在时间和幅度上都是连续的,一般用不同的电压表示。由于模拟音频信号是连续的,所以不能由计算机直接处理数字音频信号:是把表示声音强弱的模拟电压用数字表示

由于计算机只处理数字信号,因此需要将音频信号通过A/D转换成为数字信号

一段声波数字量化的质量好坏取决于以下几个因素:

采样频率:每秒采样的次数,频率越高说明采集到的点越多,越接近于实际量化位数:即采样深度、决定了采样值的精确度声道数:一次采样记录的声音波形个数,分为单声道和双声道,双声道立体感及哦啊好,但是信息量也倍增,计算公式为:存储量=(采样频率*采样位数*声道数)/8,(举例:采样频率为44.1KHz,采样数据量化位数(或称采样精度)为16位、双声道,一张60分钟的CD唱片所占存储容量为:(44.1×1000×16×2 ×3600)/8=635040000(B)≈606M) 3.2.2 声卡与声音文件的格式

@1 声卡简介:又名音频卡,主要用于处理声音,是多媒体计算机的基本配置。目前许多计算机的主板上都集成了声卡的功能,声卡不再以单独形式存在

@2 声卡的作用主要有:

A/D转换:将作为模拟量转化成数字量,然后以文件形式保存在计算机中D/A转换:把数字量转换成模拟量并输出到声音还原设备中I/O功能:利用声卡的输入/输出端口可以将模拟信号引入声卡并转换成数字信号;也可以将数字信号转换成模拟信号送到输出端口驱动音响设备发出声音

@3 声卡的主要接口:

话筒输入(Micin): 连接麦克风,还可以录制外界声音线路输入(Line in):连接录音机等外部声源,进行声音录制线路输出(Line out):连接有源音箱/功率放大器扬声器输出(Speaker Out) :连接耳机/音箱,有的只接受无源音箱和耳机,新声卡已经将扬声器输出和线路输出合二为一游戏棒/MIDI(Joystick/MIDI):用于连接游戏手柄和MIDI乐器

@4 声卡中的关键部件:

数字信号处理器DSP:声卡的核心部件,用于管理声音的输入输出以及音频信号的模/数转换和数/模转换总线接口芯片:在声卡和系统总线之间传输命令和数据混音器:可以将几个不同声源进行混合录音音乐合成器:主要用于MIDI音乐文件的播放

@5 声音文件格式说明:

3.3 数字图像 3.3.1 图像基本知识

@1 颜色的基本描述:彩色可用亮度、色调和饱和度来描述,人眼看到任意彩色光都是这三个特性的综合效果。

亮度是光作用于人眼时所引起的明亮程度的感觉。色调是反映的是颜色的种类。饱和度是指颜色的纯度,饱和度越深颜色越鲜明

@2 三原色原理:自然界常见的各种彩色光都可以由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成,这就是色彩学中最基本的原理

@3 相加混色:把三种基色光按不同比例结合时便产生一个完整的光谱,包含所有的色彩

@4 颜色空间表示:颜色通常用三个独立的属性来描述,三个独立的变量综合就构成了一个空间坐标,这就是颜色空间。

@5 颜色空间可分为两大类:基色颜色空间(RGB、CMY等) 和色、亮分离颜色空间(YUV、HSL等)

RGB色彩空间:由红、绿、蓝3种颜色光按不同比例相配而成,主要用于计算机显示 CMY色彩空间:三基色是青、品红和黄,简称为CMY,适用于彩色印刷或彩色打印。YUV和YIQ色彩空间:适用于彩色电视系统,其中Y表示亮度信号,UV表示色差信号;美国、日本采用YIQ彩色系统,Y仍为亮度信号,IQ表示色差信号HSL色彩空间:H表示色调,S表示颜色的饱和度,L表示光的亮度

@6 图像与图形的区别:

图像:由像素构成,像素是组成图像最基本的元素,每个图像点用若干个二进制位进行描述。图像通常用于表现自然景观、人物、动物、植物等复杂的场景。图形:由具有方向和长度的矢量线段构成。图形使用坐标、运算关系以及颜色数据进行描述,因此把图形叫做“矢量图”。图形的数据量小,常用于表现直线、曲线以及由各种线段围成的图形,不适于描述色彩丰富、复杂的自然影像。 3.3.2 图像数字化

一幅图像在用计算机进行处理之前必须先转化为数字形式。图像数字化过程可分为采样、量化和编码:

采样:图像采样就是对图像在水平方向和垂直方向上等间隔地分割成矩形网状结构,每个矩形网格称为像素点。像素总数就是图像的分辨率量化:是将采样值划分成各种等级,用一定位数的二进制数来表示采样的值。量化位数越大,则越能真实地反映原有图像的颜色,但得到的数字图像容量也越大。在量化时表示量化的色彩值(或灰度值)所需的二进制位数称为量化字长。一般可用8位、16位、24位或更高的量化字长来表示图像的颜色编码:图像编码是按一定的规则,将量化后的数据以二进制形式存储在文件中 3.3.3 数字图像的类型、属性与格式

@1 矢量图:向量图用一组指令描述的图形,存储空间小,但处理起来相当复杂;通常先用矢量图形穿件比较复杂的图形,在将其转换为位图对图像进行处理,矢量位图的关键技术在于图形的制作和再现

@2 位图:由像素矩阵组成,位图比矢量图显示要快,但存储空间大,位图图像的关键技术在于图像的扫描,编辑、无失真压缩,快速解压和色彩一致性再现等

@3 分辨率:分为屏幕分辨率、图像分辨率和像素分辨率

屏幕分辨率:由屏幕水平方向和垂直方向的像素数表示图像分辨率:数字化图像的大小,即打印图像时,在每英寸上打印的像素数像素分辨率:像素宽和长的比例,即像素的长宽比图像深度:每个像素点所占的二进制位数,图像深度越大,能够表示的颜色就越多,色彩也就越多,画面越逼真;

颜色数量和深度说明:颜色深度是指在某一颜色系统中图像的每个颜色所用的二进制位数,而颜色数量是指该颜色系统中共有多少种颜色,颜色深度小于24bit的图像称为索引彩色图像,其像素颜色取自一个颜色查找表中最接近的颜色,这种方法显示的颜色不是图像本身真正的颜色,称为伪彩色;

当某个图像的颜色深度达到或高于24bit时,其颜色数量已经足够多,且图像的色彩和表现力非常强,基本上还原了自然影像,习惯上把这种图像叫做真彩色图像 ;真彩色的每个像素的颜色由RGB基色分量的数值直接决定。每个基色分量占一个字节,共有3个字节即24bit,可生成的颜色数为224=16777216,即1600万种颜色;而32位真彩色是用其中的24位描述颜色部分,另外8位记录256级灰度,用以加强真彩色的质量

@4 图像文件大小:存储整幅图像所占的字节数(大小=(图像分辨率*图像深度)/8)

@5 图像文件格式与特点,常见图像格式如下:    

3.3.4 图像数据的获取和编辑 一般通过4种途径来获取:数字图像库、图像编辑软件、数字化设备、数字转换设备最常用数字图像编辑软件:photoshop 3.4 视频基础 3.4.1 什么是视频 视频:是由多幅画面组成,当画面快速连续地播放时,由于人类眼睛存在“视觉滞留效应”而产生动感。视觉滞留效应:是指当被观察的物体消失后,物体仍在大脑视觉神经中停留的时间约为1/24s,即如果每秒快速更换24个画面或更多的画面,那么,前一个画面在脑海中消失之前,下一个画面已经映入眼帘,大脑感受的影像是连续的

视频信号在生成、传递、以及加工过程中应用的标准以及制式,世界各地均不同;分为:

NTSC:美国,加拿大,日本(每秒30帧,每帧525行)PAL:德国、中国、欧洲大部分(每秒25帧,每帧625行)SECAM:法国、俄罗斯、非洲地区(类似于PAL制式) 3.4.2 视频数字化

@1 数字视频标准:MPEG(已经出台的有MPEG-1、2、 4、7、21),文件以mpg为后缀。

MPEG标准:针对运动图像设计的压缩标准,已经出台的标准简介:

MPEG压缩原理:动态图像是由一系列静态图像格式构成的,因此对静态图像的压缩方法同样适合于动态压缩,但动态图像数据量大,像JPEG这种压            缩比例达不到动态压缩的要求。

@2 动态图像在帧与帧之间表现为以下几个特点:

动态图像每秒25帧,一般在此期间图像不会有太大变化画面中变化的只是运动部分,精致部分相对来讲占用较大位置即使是运动部分,更多的只是简单的平移;因此,第一帧可以用JPEG压缩,但是在随后的帧中仅记录与前面不同的部分,播发时根据帧之间的不同构建出画面

@3 在实际的JPEG压缩中,考虑到以下两个问题:

由于之保留第一帧图像们无法实现视频的实时跳跃,一帧出问题,其他帧也播放不了差异帧的压缩是有损的,误差累积到一定程度会大面积失真,因此,往往是每隔若干帧记录一下;由于差异帧记录的是静止部分的相关性,对于运动部分,往往采用运动补偿的矢量算法

@4主流视频文件格式如下所示:  

3.4.3 视频的编辑

目前常用的视频编辑软件有adobe的premiere和微软的video for windows(VFS)

3.5 动画基础 3.5.1 计算机动画

电脑动画有两大类,一类是帧动画,另一类是矢量动画:

帧动画以帧作为动画构成的基本单位,很多帧组成一部动画片;帧动画借鉴传统动画的概念,一帧对应一个画面,每帧的内容不同;当连续演播时,形成动画视觉效果矢量动画是经过电脑计算而生成的动画,其画面只有一帧,主要表现变化的图形、线条、文字和图案。矢量动画通常采用编程或矢量动画制作软件来完成 3.5.2 计算机动画的分类

根据运动控制方式不同和视觉空间不同而由不同的分类:

@1 运动控制方式:

实时动画:算法动画、模型动画、过程动画;采用算法控制,不含有大量的数据,只对有限的数据进行快速处理将结果显示出来,常见的有电子游戏动画关键帧:帧动画;一帧一帧显示实际的图像,实现动画效果

@2 视觉空间:

二维动画:平面画面;最多也只是利用二维模拟三维世界三维动画:模拟真实三维空间,构建三维图像并作相应的处理,生成连续图像 3.5.3 计算机动画的制作

@1 二维动画软件:Flash MX2004、Animator Studio、Quick cel

@2 三维动画软件:3ds MAX 、softimage 3D、Maya

注意:制作动画应尽可能采用高速CPU,足够大的内存容量,以及大的硬盘空间,制作三维动画时最好配置较高档的显示

3.6 多媒体压缩概述

@1 严格意义上的数据压缩起源于人们对概率的认识,当我们对文字信息进行压缩编码时,如果为出现概率较高的字母赋予较短的编码,为出现概率较低的字母赋予较长的编码,总的编码长度就能缩短不少

@2 压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的)

@3 多媒体数据可以被压缩,是因为其中存在着冗余信息,分类如下:

空间冗余:图像中的某个区域相邻像素的颜色信息相同,则该相邻像素在数字化图像中就表现为空间冗余时间冗余:在一个图像序列的两幅相邻图像中,后一幅图像与前一幅图像之间有着较大的相关结构冗余:有些图像的纹理区,图像的像素值存在着明显的分布模式;于是,已知分布模式,可以通过某一过程生成图像知识冗余:有些图像的理解与某些基础知识有相当大的相关性。例如,人脸的图像有固定的结构视觉冗余:是指人的视觉分辩率要低于实际图像而产生的冗余。例如,人的视觉对灰度的分辩率为26,而一般图像量化采用的灰度等级为28

@4 多媒体数据压缩的主要方法:统计编码、预测编码、变换编码等



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3