第5章视频处理技术学习目标 (1) 掌握数字视频的概念和数字视频的特点。 (2) 了解数字视频信息获取的基本原理和方法。 (3) 掌握数字视频的编辑和处理方法。 (4) 了解视频编辑软件的工作流程。 (5) 知道常见的视频编辑技巧。视频就是一组随时间连续变化的图像。当连续的图像变化每秒超过24幅画面以上时,根据视觉暂留原理,人眼无法辨别出单幅的静态画面,会产生平滑连续的视觉效果,这种连续变化的画面组称为视频或者动态图像等。 视频是通过摄像直接从现实世界中获取的,能够使人们感性地认识和理解多媒体信息所表达的含义。视频分为模拟视频和数字视频。本章主要介绍数字视频的基本概念、视频采集、输出和压缩标准、视频处理软件Premiere的基本功能与应用方法。 5.1视频处理技术概述〖*4/5〗5.1.1模拟视频与数字视频视频(Video)这个术语来源于拉丁语的“我能看见的”,通常指不同种类的活动画面,又称影片、录像、动态影像等,泛指将一系列静态图像以电信号方式加以捕捉、记录、存储、传送与重现的各种技术。按照视频的存储方式与处理方式的不同,视频可分为模拟视频和数字视频两大类。 1. 模拟视频 模拟视频(Analog Video)属于传统的电视视频信号范畴,指每一帧图像是实时获取的自然景物的真实图像信号。模拟视频信号是基于模拟技术以及图像显示的国际标准来产生视频画面的,具有成本低、还原性好等优点,视频画面往往会给人一种身临其境的感[1][3]多媒体技术与应用教程(第2版)第5章视频处理技术[3][3]觉。它的缺点是,不论被记录的图像信号有多好,经长时间的存储或多次复制之后,信号和画面的质量将会明显地降低。 电视信号是视频处理的重要信息源。电视信号的标准也称为电视的制式。目前各国的电视制式不尽相同。不同制式之间的主要区别在于不同的刷新速度、颜色编码系统和传送频率等。目前世界上最常用的模拟广播视频标准(制式)有中国、欧洲使用的PAL制,美国、日本使用的NTSC制及法国等国家所使用的SECAM制。 NTSC标准是1952年美国国家电视标准委员会(National Television Standard Committee)制定的一项标准。其基本内容为: 视频信号的帧由525条水平扫描线构成,水平扫描线采用隔行扫描方式,每隔1/30秒在显像管表面刷新一次,每一帧画面由两次扫描完成,每一次扫描画出一个场,需要1/60秒完成,两个场构成一帧。美国、加拿大、墨西哥、日本和其他许多国家都采用该标准。 PAL(Phase Alternate Lock)标准是联邦德国1962年制定的一种兼容电视制式。PAL意指“相位逐行交变”,主要用于欧洲大部分国家、澳大利亚、南非、中国和南美洲。屏幕分辨率增加到625条线,扫描速率降到了25帧/秒,采用隔行扫描方式。 SECAM标准是Sequential Color and Memory的缩写,该标准主要用于法国、东欧、前苏联和其他一些国家,是一种625线、50Hz的系统。 模拟视频信号主要包括亮度信号、色度信号、复合同步信号和伴音信号。在PAL彩色电视制式中采用YUV模型来表示彩色图像。其中,Y表示亮度,U、V表示色差,是构成彩色的两个分量。与此类似,在NTSC彩色电视制式中使用YIQ模型,其中的Y表示亮度,I、Q是两个彩色分量。YUV表示法的重要性是它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是Y信号分量构成的黑白灰度图与用U、V信号构成的另外两幅单色图是相互独立的。由于Y、U、V是独立的,所以可以对这些单色图分别进行编码。 2. 数字视频 数字视频(Digital Video)是相对于模拟信号而言的,指以数字形式记录的视频。数字视频有不同的产生方式、存储方式和播出方式。模拟视频可以通过视频采集卡将模拟视频信号进行A/D(模/数)转换,这个转换过程就是视频捕捉(或采集过程),再将转换后的信号采用数字压缩技术存入计算机磁盘中就成为了数字视频。 相对于模拟视频而言,数字视频具有如下特点。 (1) 数字视频可以不失真的进行无数次复制。 (2) 数字视频便于长时间存放而不会有任何的质量降低。 (3) 可以对数字视频进行非线性编辑,并可增加特技效果等。 (4) 数字视频数据量大,在存储与传输的过程中必须进行压缩编码。 5.1.2线性编辑与非线性编辑〖*4/5〗1. 线性编辑线性编辑是视频的传统编辑方式。视频信号顺序记录在磁带上。在进行视频编辑时,编辑人员通过放像机播放磁带选择一段合适的素材,把它记录到录像机中的一个磁带上,然后再顺序寻找所需要的视频画面,并进行记录。如此反复操作,直至把所有合适的素材按照节目要求全部顺序记录下来。这种按顺序进行视频编辑的方式称为线性编辑。 2. 非线性编辑 非线性视频编辑是针对数字视频文件的编辑。在计算机的软件编辑环境中进行视频后期编辑制作,能实现对原素材任意部分的随机存取、修改和处理。这种非顺序结构的编辑方式称为非线性编辑。 非线性编辑具有如下几个特点。 (1) 非线性编辑的素材以数字信号的形式存储在计算机硬盘中,可以随调随用,完成快速搜索,精确定位,图像的质量可以控制。 (2) 非线性编辑具备强大的编辑功能。一套完整的非线性编辑系统往往集成了录制、编辑、特技、字幕、动画等功能,这是线性编辑无法比拟的。 (3) 非线性编辑系统的投入相对较少,设备维护、维修及工作运行成本都较线性编辑大为降低。 非线性视频编辑的这些特点已使它成为电视节目编辑的主要方式。 5.2视频信号数字化〖*4/5〗5.2.1数字视频的采集获取数字视频信息主要有两种方式: 一种是利用数码摄像机拍摄的景物,可以直接获得无失真的数字视频;另一种是通过视频采集卡把模拟视频转换成数字视频,并按数字视频文件的格式保存下来。 一个数字视频采集系统由三部分组成: 一台配置较高的多媒体计算机系统,一块视频采集卡和视频信号源,如图51所示。 图51数字视频采集系统 1. 视频采集卡的功能 在计算机上通过视频采集卡可以接收来自视频输入端(录像机、摄像机和其他视频信号源)的模拟视频信号,对该信号进行采集、量化,使之成为数字信号,然后将其压缩编码成数字视频序列。大多数视频采集卡都具备硬件压缩的功能。在采集视频信号时,首先在卡上对视频信号进行压缩,然后通过PCI接口把压缩的视频数据传送到主机上。一般的视频采集卡采用帧内压缩的算法把数字化的视频存储成AVI文件,高档一些的视频采集卡还能直接把采集到的数字视频数据实时压缩成MPEG1格式的文件。 由于模拟视频输入端可以提供不间断的信息源,视频采集卡要采集模拟视频序列中的每帧图像,并在采集下一帧图像之前把这些数据传入计算机系统,因此,实现实时采集的关键是每一帧所需的处理时间。如果每帧视频图像的处理时间超过相邻两帧之间的相隔时间,就会出现数据的丢失,即丢帧现象。采集卡都是把获取的视频序列先进行压缩处理,然后再存入硬盘。也就是说,视频序列的获取和压缩是在一起完成的,这样免除了再次进行压缩处理的不便。 2. 视频采集卡的工作原理 视频采集卡的结构如图52所示。多通道的视频输入用来接收视频输入信号,视频信号源首先经A/D(模拟/数字)转换器将模拟信号转换成数字信号,然后由视频采集控制器对其进行剪裁、改变比例后压缩存入帧存储器。输出模拟视频时,帧存储器的内容经D/A(数字/模拟)转换器把数字信号转换成模拟信号并输出到电视机或录像机中。 图52视频采集卡的结构 3. 视频采集卡与外部设备的连接 视频采集卡一般不具备电视天线接口和音频输入接口,不能用视频采集卡直接采集电视射频信号,也不能直接采集模拟视频中的伴音信号。要采集伴音,计算机必须安装声卡。视频采集卡通过计算机上的声卡获取数字化的伴音,并把伴音与采集到的数字视频同步到一起。 外部设备与视频采集卡的连接包括模拟设备视频输出端口与采集卡视频输入端口的连接,以及模拟设备的音频输出端口与多媒体计算机声卡的音频输入端口的连接。利用录像机(摄像机)来提供模拟信号源,用电视机来监视录像机输出信号。连接关系如图53所示。 图53视频采集卡与外部设备的连接 设VHS录像机具有Video Out、 Audio Out(R、L)和 RF Out输出端口,则把录像机的Video Out 与采集卡的Video In相连,录像机的Audio Out 与声卡的Line In相连,录像机的RF Out 与电视机的RF In相连,声卡的Speaker Out 与音箱相连。按照这种连接关系,如果软件设置正确,则通过多媒体计算机的音箱可以监视采集的伴音情况,而采集的视频序列将直接显示在多媒体计算机显示器上。 5.2.2数字视频的输出 数字视频的输出是数字视频采集的逆过程,即把数字视频文件转换成模拟视频信号输出到电视机上进行显示,或输出到录像机记录到磁带上。与视频采集类似,这需要使用专门的设备来把数字视频进行解压缩及D/A变换,完成数字数据到模拟信号之间的转换。根据不同的应用和需要,这种转换设备也分很多种。集模拟视频采集与输出于一体的高档视频采集卡插在PC的扩充槽中。可以将其与较专业的录像机相连,提供高质量的模拟视频信号采集和输出。这种设备可以用于专业级的视频采集、编辑及输出。 另外,还有一种称为TV编码器(TV Coder)的设备,它的功能是,把计算机显示器上显示的所有内容转换为模拟视频信号并输出到电视机或录像机上。这种设备的功能较为有限,适合于普通的多媒体应用。 5.3数字视频压缩标准与文件格式〖*4/5〗5.3.1数字视频数据压缩标准未压缩的数字视频数据量是非常大的,因而需要采用有效的途径对其进行压缩。人们从视频数据的冗余可能出发,分析研究出了一系列编码压缩算法。其方法可分为帧内压缩和帧间压缩两种。 帧内压缩: 当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,帧内一般采用有损压缩算法,达不到很高的压缩比。 帧间压缩: 是基于许多视频或动画连续两帧具有很大的相关性(即连续视频的相邻帧之间具有冗余信息)的特点来实现的。通过比较时间轴上不同帧之间的数据实施压缩,能够进一步提高压缩比。 与音频压缩编码类似,为了使图像信息系统及设备具有普遍的互操作性,一些相关的国际化组织先后审议制定了一系列有关图像编码的标准。其中,MPEG系列标准由运动图像专家组(Moving Picture Experts Group)制定。 MPEG系列标准包含MPEG1、MPEG2、MPEG4、MPEG7和MPEG21 5个具体标准,每种编码都有各自的目标问题和特点。 MPEG1标准的目标是以大约1.5Mb/s的速率传输电视质量的视频信号,亮度信号的分辨率为360×240,色度信号的分辨率为180×120,每秒传输30帧。这是世界上第一个用于运动图像及其伴音的编码标准,主要应用于VCD。其音频第3层即MP3是目前十分流行的编码标准。该标准于1988年5月提出,1992年11月形成国际标准。 MPEG2标准于1990年6月提出,1994年11月形成国际标准。该标准的视频分量的位速率范围为2~15Mb/s,分辨率有低(350×288)、中(720×480)、次高(1440×1080)、高(1920×1080)等不同档次,压缩编码方法也从简单到复杂分为很多不同等级。该标准广泛应用于数字机顶盒、DVD和数字电视。 MPEG4标准于1993年7月提出,1999年5月形成国际标准。该标准是一种基于对象的视、音频编码标准。它采用MPEG4技术,一个场景可以实现多个视角、层次、多个音轨以及立体声和3D视角。这些特性使得虚拟现实成为可能。MPEG4标准制定了大范围的级别和框架,可广泛应用于各行各业。 MPEG7标准于1997年7月提出,在2001年9月形成国际标准。该标准是一种多媒体内容描述标准,定义了描述符、描述语言和描述方案,支持对多媒体资源的组织管理、搜索、过滤和检索等,便于用户对其感兴趣的多媒体素材内容进行快速有效的检索。可应用于数字图书馆、各种多媒体目录业务、广播媒体的选择和多媒体编辑等领域。 MPEG21标准与MPEG7标准几乎是同步制定的,前者于2001年12月完成。MPEG21标准的重点是建立统一的多媒体框架,为从多媒体内容发布到消费所涉及到的所有标准提供基础体系,支持连接全球网络的各种设备透明地访问各种多媒体资源。 H.264是一种视频高压缩技术,全称是MPEG4 AVC,即活动图像专家组4的高等视频编码。它是由国际电信联盟远程通信标准化组织ITUT和规定MPEG的国际标准化组织ISO及国际电工委员会IEC共同制定的一种活动图像编码方式的国际标准格式。H.264的优势主要在于超高压缩率、高国际标准和公正的无差别许可制度。 5.3.2数字视频文件格式 数字视频文件格式大致可分为两类: 普通视频文件格式和网络流式视频文件格式。 1. 普通视频文件格式 1) AVI格式 AVI(Audio Video Interleaved)是一种音、视频交叉记录的数字视频文件格式,运动图像和伴音数据是以交替的方式存储的。这种音频和视像的交织组织方式与传统的电影相类似,在电影中包含图像信息的帧顺序显示,同时伴音声道也同步播放。 AVI文件结构不仅解决了音频和视频的同步问题,而且具有通用和开放的特点。它可以在任何Windows环境下工作,而且还具有扩展环境的功能。用户可以开发自己的AVI视频文件,在Windows环境下可以随时调用它。 AVI一般采用帧内有损压缩。可以用一般的视频编辑软件(如Adobe Premiere)对其进行再编辑和处理。这种文件格式的优点是,图像质量好,可以跨平台使用;缺点是,文件体积较大。 2) MEPG格式 MPEG(Moving Picture Expert Group)/MPG/DAT格式,具体格式后缀可以是mpeg、mpg或dat,家庭使用的VCD、SVCD和DVD就是MPEG格式文件。 将MPEG算法用于压缩全运动视频图像,就可以生成全屏幕活动视频标准文件——MPG文件。MPG格式文件在1024×786的分辨率下可以用25帧/秒(或30帧/秒)的速率同步播放全运动视频图像和CD音乐伴音,并且其文件大小仅为AVI文件的1/6。MPEG2压缩技术采用可变速率(Variable Bit Rate,VBR)技术,能够根据动态画面的复杂程度,适时改变数据传输率,以获得较好的编码效果。目前使用的DVD就采用了这种技术。 MPEG的平均压缩比为50∶1,最高可达200∶1。压缩效率之高由此可见一斑。同时,图像和音响的质量也非常好。MPEG标准包括MPEG视频、MPEG音频和MPEG系统 (视频、音频同步)3个部分。MP3音频文件就是MPEG音频的一个典型应用,而VCD、SVCD、DVD则是全面采用MPEG技术所产生出来的新型消费类电子产品。 3) MOV格式 MOV(MOvie digital Video technology)是美国Apple公司开发的一种视频文件格式,默认的播放器是QuickTime Player,具有较高的压缩比和较好的视频清晰度,并且可跨平台使用。 2. 网络视频文件格式 1) RM格式 RM是Real Networks公司开发的一种流媒体文件格式,是目前主流的网络视频文件格式。Real Networks所制定的音频、视频压缩规范称为Real Media,相应的播放器为Real Player。 2) ASF格式 ASF(Advanced Streaming Format)格式是Microsoft公司前期的流媒体格式,采用MPEG4压缩算法。这是一种可以在互联网上实时观看的视频文件格式。 3) WMV格式 WMV(Windows Media Video )格式是Microsoft公司推出的采用独立编码方式的视频文件格式,是目前应用最广泛的流媒体视频格式之一。 5.4视频编辑软件Premiere 在一个完整的非线性编辑系统中,硬件能提供的只是对音频、视频数据的输入、输出、压缩、解压缩、存储等工作的处理环境,对于视频、音频的编辑,则要通过非线性编辑应用软件才能实现,即数字视频的后期编辑工作主要依靠视频编辑软件来完成。 目前市场上的非线性编辑软件种类较多,比较流行的是 Adobe公司的Premiere系列和Ulead公司的Video Studio(会声会影)系列。它们可以和大多数的视频采集卡配合使用。在工作原理上,这两款软件基本相似,都采用了时间轴和各种素材轨道的编辑方法。本节主要介绍Adobe Premiere数字视频编辑软件的功能和使用方法。Adobe Premiere软件为剪辑人员提供了非常实用的工具,能让用户得心应手地完成剪辑任务。 5.4.1Premiere编辑影片流程 Premiere非线性编辑的工作流程,可以简单地看成创建项目文件、输入素材、编辑素材和输出影片这几个步骤。 1. 创建Premiere项目文件 图54Premiere CS4启动界面启动Premiere CS4程序时,系统会询问是否新建或者打开项目,如图54所示。选择“新建项目”后弹出“新建项目”对话框,如图55所示。单击“确定”按钮后弹出图56所示的对话框。在“序列预置”选项卡中,选择DVPAL制式标准48kHz,也可以选择“常规”选项卡进行自定义,如图57所示。 图55“新建项目”对话框 图56预设方案 图57“常规”选项卡 每种预设方案中包括文件的压缩类型、视频尺寸、播放速度、音频模式等方面的信息,用户也可以在“常规”选项卡中进行手动调整。单击“确定”按钮,确定所选的预设方案。Premiere CS4启动后界面主要包括项目窗口、监视器窗口、时间线窗口、特效窗口以及工具面板、效果控制面板、信息面板等,如图58所示。 图58Premiere CS4编辑界面 项目窗口的主要功能是对素材进行存放和管理。对视、音频素材进行编辑时,首先要导入这些素材并进行相应的设置与管理,以便分类和安排编辑次序。项目管理还提供了