融媒体技术 温怀疆 何光威 史 惠 主 编 段永良 副主编 内 容 简 介 本书以广播传媒类节目的采集、制作、播发、传输、覆盖、监测、接收与重现为主线,将全书划 分为5大模块——基础与概念、制作与播发、存储与检索、传输与覆盖,以及融合与创新,共12章。 全书汲取相关类似读物的优点,并结合作者多年来的实践与教学经验,在原有传统广播电视技术 的基础上进行了一些探索和创新,增添了不少新的广电媒体融合方面的新技术与新方案,以开拓读者视 野,如因特网、云计算、大数据、虚拟现实、在线包装、基于内容的检索技术、TVOS、NGB云平台、 NGB-W、DCAS、物联网技术、极清电视、裸眼3D电视技术以及无人机航拍技术等等。 本书内容涉及面较广,但主要侧重知识和概念的导入,摆脱大量公式推导,简化内容深度,可 适用于传媒类院校的普通类和艺术类学生作为导引课来学习和参考,也可作为广电传媒领域刚入职新 员工的入门读物。 本书封面贴有清华大学出版社防伪标签,无标签者不得销售。 版权所有,侵权必究。侵权举报电话:010-62782989 13701121933 图书在版编目(CIP)数据 融媒体技术 / 温怀疆,何光威,史惠主编. — 北京:清华大学出版社,2016 ISBN 978-7-302-44899-0 Ⅰ. ①融… Ⅱ. ①温… ②何… ③史… Ⅲ. ①传播媒介—研究 Ⅳ. ①G206.2 中国版本图书馆CIP数据核字(2016)第201735号 责任编辑:杨如林 封面设计:铁海音 责任校对:徐俊伟 责任印制:宋 林 出版发行:清华大学出版社 网  址:http://www.tup.com.cn,http://www.wqbook.com 地  址:北京清华大学学研大厦A座 邮  编:100084 社 总 机:010-62770175 邮  购:010-62786544 投稿与读者服务:010-62776969,c-service@tup.tsinghua.edu.cn 质 量 反 馈:010-62772015,zhiliang@tup.tsinghua.edu.cn 印 装 者:三河市春园印刷有限公司 经  销:全国新华书店 开  本:185mm×260mm 印  张:20.75 字  数:442千字 版  次:2016年9月第1版   印  次:2016年9月第1次印刷 印  数:1~3000 定  价:49.80元 ————————————————————————————————————————————— 产品编号:070682-01 前 言 融媒体是全媒体功能、传播手段乃至组织结构等核心要素的结合、汇聚和融合,是 信息传输渠道多元化下的新型运作模式。在媒体融合势态下,传统媒体将与互联网、移 动互联网等新兴媒体传播渠道有效地结合,实现资源共享、集中处理,能衍生出多种形 式的信息产品,多渠道广泛地传播给受众。 本书作者多年来在浙江传媒学院和中国传媒大学南广学院从事“广播电视技术概 论”“音视频技术概论”和“媒介技术概论”等课程的教学工作,根据教学反馈和学生 们迫切需要,在对融媒体技术进行系统梳理的基础上,结合这几年的科研积累和实际教 学经验编写了本书。本书内容主要侧重一些知识和概念的导入,注重逻辑性、系统性和 概念内涵的准确性、权威性。因此,本书经过任课老师对内容的取舍后可用于传媒相关 专业的普通类和艺术类学生的学习。本书的特点是以广播电视节目的采集、制作、存 储、播发、管理、传输、覆盖、监测、接收与重现为主线,在介绍传统广播电视传媒技 术的基础上,融入了媒体融合方面的新技术和新方案,用于开拓读者视野,如因特网、 云计算、大数据、虚拟现实、在线包装技术、基于内容的检索技术、TVOS、NGB云平 台、NGB-W、DCAS、OTT、云技术、移动多媒体覆盖、同步数字广播、裸眼3D电视技 术、大屏显示技术以及无人机航拍等。 全书主要包括5大模块:基础与概念、制作与播发、存储与检索、传输与覆盖以及 融合与创新,共12章,从融媒体概念、电声基础、电视基础开始,沿着广播电视的制作 生产和传输发射流程对现代广播电视传媒技术进行介绍,内容涉及音频和视频的主要特 性;数字音频和视频的主要压缩技术;广播电视中心概况;音频和视频主要设备;电视 节目的制作技术与方式;电视播控技术;媒体存储、管理、检索技术;音频广播的发射 覆盖;数字音频广播的发射与覆盖;电视广播的传输与覆盖以及一些融合媒体技术的新 理论与新实践等。 本书由浙江传媒学院温怀疆副教授和中国传媒大学南广学院何光威副教授共同起草 策划,由温怀疆、史惠(浙江传媒学院)和何光威、段永良(中国传媒大学南广学院) 共同编著,其中温怀疆、何光威、史惠为共同主编,段永良为副主编。第1、11章由何光 威、温怀疆编写,第2、9、10、12章由温怀疆编写,第3、4、7、8章由史惠编写,第5章 由史惠、何光威编写、第6章由史惠、段永良编写。为保证质量,书稿在作者之间进行了 相互审阅,书中的20多幅CAXA插图由浙江传媒学院13通信专业的徐琼翔同学绘制,本 书配套PPT由浙江传媒学院通信专业的姚文洁、刘艾萌同学负责制作。全书由温怀疆整 理、统稿。在本书编写过程中不仅参考了一些相关期刊的论文,而且也参考了网上论坛 的一些未留名的高手手记,在此一并表示感谢。 本书可供高等学校传媒类普通专业和艺术类专业教学使用,也可作为媒体行业入职 人员岗位培训的教材和传媒从业人员的参考资料。 作者 于浙江传媒学院&中国传媒大学南广学院 1.4.2 数据存储单位的换算 ··········································································24 1.4.3 大数据产业市场主体 ··········································································24 1.4.4 大数据的特点 ···················································································25 1.4.5 大数据技术 ······················································································25 1.4.6 大数据的媒体应用 ·············································································26 1.5 虚拟现实 ······················································································· 27 1.5.1 虚拟现实定义 ···················································································27 1.5.2 基本特征 ·························································································28 1.5.3 系统构成和实现过程 ··········································································28 1.5.4 技术优点 ·························································································29 1.5.5 支撑技术 ·························································································29 1.5.6 关键技术 ·························································································30 1.5.7 虚拟现实系统的分类 ··········································································33 1.5.8 应用领域 ·························································································34 1.6 未来的媒体技术 ·············································································· 36 1.6.1 下一代网络技术 ················································································36 1.6.2 光传输技术 ······················································································37 1.6.3 纳米技术 ·························································································37 1.7 思考与练习 ···················································································· 37 第2章电声基础 ················································································ 39 2.1 声音的产生与传播 ··········································································· 39 2.1.1 声音和声波 ······················································································39 2.1.2 声波的产生与传播 ·············································································39 2.2 重要声学物理量 ·············································································· 40 2.2.1 频率、周期、波长和声速 ····································································40 2.2.2 倍频程 ····························································································42 2.2.3 声功率 ····························································································42 2.2.4 声强 ·······························································································43 2.2.5 声强级 ···························································································43 2.2.6 声压 ·······························································································43 2.2.7 声压级 ····························································································43 2.3 音质的三要素 ················································································· 44 2.3.1 响度 ·······························································································44 2.3.2 音调 ·······························································································46 2.3.3 音色 ·······························································································46 2.4 人耳的听觉特性 ·············································································· 47 2.4.1 听觉系统 ·························································································47 2.4.2 听阈特性和听域 ················································································47 2.4.3 掩蔽效应 ·························································································48 2.4.4 哈斯效应 ·························································································50 2.5 声音的混响 ···················································································· 50 2.5.1 混响和回声的概念 ·············································································50 2.5.2 电子混响 ·························································································51 2.6 分贝的概念 ···················································································· 51 2.6.1 分贝定义 ·························································································51 2.6.2 电信号的分贝值 ················································································52 2.6.3 声音的分贝值 ···················································································52 2.7 VU、PPM表与dBFS ········································································· 53 2.7.1 VU表······························································································53 2.7.2 PPM表 ····························································································53 2.7.3 数字满度电平 ···················································································54 2.8 立体声原理 ···················································································· 54 2.8.1 双耳听觉特性 ···················································································54 2.8.2 立体声的概念 ···················································································56 2.8.3 双声道立体声拾音技术 ·······································································57 2.9 音频的数字化与编码 ········································································ 61 2.9.1 数字音频 ·························································································61 2.9.2 音频编码压缩 ···················································································66 2.10 思考题 ························································································ 68 第3章电视基础 ················································································ 69 3.1 视觉和光学基础 ·············································································· 69 3.1.1 光的基础 ·························································································69 3.1.2 视觉特性 ·························································································71 3.1.3 色度学基础 ······················································································74 3.1.4 颜色的度量与亮度方程 ·······································································76 3.2 图像特性 ······················································································· 79 3.2.1 图像的重要参数 ················································································79 3.2.2 矢量图和位图 ···················································································81 4.2.3 调音台 ·························································································· 118 4.2.4 录音设备 ······················································································· 120 4.2.5 监听耳机 ······················································································· 121 4.2.6 周边设备 ······················································································· 121 4.3 视频系统······················································································123 4.3.1 摄像机 ·························································································· 123 4.3.2 录像机 ·························································································· 128 4.3.3 切换台 ·························································································· 128 4.4 控制室和周边系统··········································································130 4.4.1 控制室 ·························································································· 130 4.4.2 周边系统 ······················································································· 131 4.5 主要音视频接插口··········································································133 4.5.1 3.5mm和6.35mm插头 ········································································ 133 4.5.2 卡侬头 ·························································································· 133 4.5.3 RCA ····························································································· 134 4.5.4 BNC ····························································································· 134 4.5.5 HDMI ··························································································· 134 4.6 思考题·························································································135 第5章电视节目制作 ······································································136 5.1 编辑制作技术················································································136 5.1.1 线性编辑 ······················································································· 136 5.1.2 非线性编辑 ···················································································· 137 5.1.3 视频切换 ······················································································· 142 5.1.4 数字视频特技 ················································································· 144 5.1.5 字幕 ····························································································· 146 5.1.6 索贝4k后期制作的整体解决方案 ························································· 146 5.2 电视节目制作方式··········································································147 5.2.1 电子新闻节目采集系统(ENG) ························································· 147 5.2.2 现场节目制作系统(EFP) ································································ 147 5.2.3 电子演播室制作( ESP) ································································· 148 5.3 虚拟演播室···················································································149 5.3.1 虚拟演播室的发展 ··········································································· 151 5.3.2 虚拟演播室的分类 ··········································································· 152 5.3.3 虚拟演播室的构成 ··········································································· 153 5.3.4 工作原理 ······················································································· 154 5.3.5 虚拟演播室关键技术 ········································································ 155 5.3.6 技术展望 ······················································································· 159 5.4 在线图文包装技术··········································································159 5.4.1 在线图文包装技术的概念 ·································································· 159 5.4.2 在线图文包装技术的特点 ·································································· 159 5.4.3 渲染技术 ······················································································· 161 5.4.4 在线图文包装系统 ··········································································· 161 5.4.5 在线包装系统的应用 ········································································ 163 5.5 全媒体演播中心·············································································165 5.5.1 全媒体的含义 ················································································· 165 5.5.2 全媒体演播中心的组成 ····································································· 165 5.5.3 全媒体中心的发展趋势 ····································································· 167 5.6 思考题·························································································168 第6章电视中心播控系统 ······························································169 6.1 节目播控系统概述··········································································169 6.1.1 播控中心的组成与结构 ····································································· 169 6.1.2 与播出的相关名词 ··········································································· 169 6.2 播控系统······················································································170 6.2.1 总控系统 ······················································································· 170 6.2.2 播出系统 ······················································································· 170 6.2.3 软件系统 ······················································································· 173 6.3 全台网技术···················································································173 6.3.1 全台网的概念 ················································································· 173 6.3.2 系统组成 ······················································································· 173 6.3.3 系统总线架构 ················································································· 174 6.3.4 系统总体流程 ················································································· 175 6.4 3G/4G直播系统 ·············································································176 6.4.1 3G/4G直播系统组成········································································· 176 6.4.2 3G/4G播发模式··············································································· 177 6.4.3 3G/4G直播服务器的部署方式 ···························································· 179 6.4.4 4G直播技术 ···················································································· 180 6.5 思考题·························································································181 9.1.2 广播电视频段的划分 ········································································ 216 9.1.3 广播电视载波信息的类型 ·································································· 217 9.1.4 电波的传播 ···················································································· 217 9.1.5 无线多径波 ···················································································· 219 9.2 调制技术概述················································································220 9.2.1 模拟信号和数字信号 ········································································ 220 9.2.2 调制的概念和意义 ··········································································· 220 9.2.3 模拟调制 ······················································································· 220 9.2.4 数字调制 ······················································································· 221 9.3 调幅广播······················································································222 9.3.1 技术要求 ······················································································· 222 9.3.2 调幅广播发射台的组成 ····································································· 222 9.3.3 调幅发射机 ···················································································· 224 9.3.4 调幅广播的接收 ·············································································· 225 9.4 调频广播······················································································226 9.4.1 技术要求 ······················································································· 226 9.4.2 调频广播的优点 ·············································································· 227 9.4.3 立体声广播 ···················································································· 227 9.4.4 调频广播发射系统的组成 ·································································· 228 9.4.5 调频广播的接收 ·············································································· 229 9.5 广播发射台系统的配置····································································229 9.6 音频广播的监控·············································································230 9.6.1 总体系统架构 ················································································· 232 9.6.2 自台监测系统 ················································································· 232 9.7 数字广播······················································································233 9.7.1 数字音频广播制式 ··········································································· 233 9.7.2 数字广播的优势 ·············································································· 234 9.7.3 数字音频广播的关键技术 ·································································· 234 9.7.4 DAB ····························································································· 236 9.6.5 DRM····························································································· 238 9.7.6 CDR ····························································································· 241 9.8 思考题·························································································242 第10章电视广播传输与覆盖 ························································243 10.1 地面广播电视系统 ········································································243 11.2.3 融合媒体平台架构 ·········································································· 281 11.2.4 三微一端 ······················································································ 283 11.3 NGB云平台·················································································283 11.3.1 NGB的“云”“管”“端” ······························································ 284 11.3.2 云媒体 ························································································· 284 11.3.3 云宽带 ························································································· 285 11.3.4 云通信 ························································································· 286 11.3.5 云服务 ························································································· 287 11.4 物联网与传媒 ··············································································288 11.4.1 物联网的定义 ················································································ 288 11.4.2 物联网智能媒体 ············································································· 288 11.4.3 媒体物联网的技术架构 ···································································· 288 11.4.4 物联网的核心技术 ·········································································· 289 11.4.5 物联网媒体内容服务平台 ································································ 290 11.5 思考题 ·······················································································290 第12章融合创新 ············································································292 12.1 应急广播技术 ··············································································292 12.1.1 国外的应急广播 ············································································· 292 12.1.2 我国的应急广播体系建设 ································································· 293 12.2 广电运营管理与信息安全 ·······························································295 12.2.1 BOSS ·························································································· 295 12.2.2 IPCC ··························································································· 296 12.2.3 DCAS ·························································································· 298 12.2.4 广电信息安全 ················································································ 298 12.3 NGB-W技术················································································299 12.3.1 系统架构 ······················································································ 299 12.3.2 系统特点 ······················································································ 300 12.3.3 应用领域 ······················································································ 301 12.4 超高清电视和3D电视·····································································302 12.4.1 4k电视 ························································································· 302 12.4.2 8k电视 ························································································· 303 12.4.3 3D电视 ························································································ 304 12.5 大屏显示技术 ··············································································308 12.5.1 曲面电视 ······················································································ 308 12.5.2 LED高分辨显示 ············································································· 309 12.5.3 大屏拼接技术 ················································································ 310 12.6 无人机航拍 ·················································································311 12.6.1 无人机的概念 ················································································ 311 12.6.2 无人机航拍飞控技术 ······································································· 312 12.6.3 航拍无人机的核心部件 ···································································· 312 12.6.4 航拍无人机的基本功能 ···································································· 312 12.7 思考题 ·······················································································313 参考文献·················································································314 基础与概念篇 念已经涵盖了“全媒体”的基本内容。此外,除了包含媒体要“全”的意思外,“融媒 体”还注重各种介质之间的“融”,即打通介质、平台,再造新闻生产与消费各个环节 的流程。如图1-1所示。 1.1.1 相关概念 媒体(Media)一词来源于拉丁语Medius,音译为媒介,意为两者之间。媒体是指传 播信息的媒介,是指人用来传递信息与获取信息的工具、渠道、载体、中介物或技术手 段。也可以把媒体看作实现信息从信息源传递到受信者的一切技术手段。媒体有两层含 义,一是承载信息的物体,二是储存、呈现、处理、传递信息的实体。 (1)传统媒体主要是指电视、广播、报纸、期刊(杂志)这四大类。 (2)新媒体是在新的技术支撑体系下出现的媒体形态,如数字杂志和报纸、数字广 播和电视、手机短信、移动电视、数字电影、互联网、移动互联网等。相对于传统意义 上的四大媒体,新媒体被形象地称为“第五媒体”。 (3)“超媒体”是超级媒体的缩写。超媒体是一种采用非线性网状结构对块状多媒 体信息(包括文本、图像、视频等)进行组织和管理的技术。 (4)多媒体(Multimedia)是多种媒体的综合,一般包括文本、声音和图像等多种 媒体内容。多媒体是超媒体(Hypermedia)系统中的一个子集,而超媒体系统是使用超 链接把各种素材组织起来。在计算机系统中,多媒体指组合两种或两种以上媒体的一种 人机交互式信息交流和传播媒体。使用的素材包括文字、图片、照片、声音 、动画和影 片,并提供互动功能。 (5)“全媒体”信息采用文字(Text)、声音(Audio)、影像(Video)、图像 (Image)、动画(Animation)、网页(Web page)等多种表现手段,利用广播、电 视、音像、出版、报纸、网站等不同媒介形态(业务融合),通过融合的广电网络、 电信网络以及互联网络进行传播(三网融合),最终实现用户以电视、电脑、手机 等多种终端均可完成信息的融合接收(多屏互动),实现任何人(Who)、任何时间 (When)、任何地点(Where)、以任何终端(What)均能够准确、及时获得任何想要 (Want)的信息(5W)。 (6)融媒体目前还没有一个被社会公认的、准确的定义。根据《电视台融合媒体平 台建设技术白皮书》的定义:融合媒体是全媒体功能、传播手段乃至组织结构等核心要 素的结合、汇聚和融合,是信息传输渠道多元化下的新型运作模式。这一概念是随着信 息技术和通信技术的发展、应用和普及从以前的“跨媒体”逐步衍生而成的。对“融媒 体”目前的理解就是融合多种的跨界媒体,其所指并不是一个个体概念,而是一个集合 概念。图1-2为基于广电业务的融合媒体技术平台架构。 第 章 融媒体及相关技术基础 1 3 全媒体聚合 现有系统1现有系统2现有系统n 全媒体 融合生 产平台 融合资源平台 (资源、应用、用户) 内容 融合 业务 融合 互联网+广电 多渠道拓展,多业态运营 内置生产工具 本地库 本地库 本地库 图1-2 基于广电业务的融合媒体技术平台架构 1.1.2 融媒体的特征 融媒体是传统媒体与新兴互联网媒体融合的产物,在融合形势下,媒体形式、生产 平台和传播方式都发生了很大变化。 从媒体形式层面来看,①传统的有线、无线、卫星单向广播电视,观众只能看不能 说;②VOD 点播、时移电视、IPTV 、网络视频、互联网电视带有简单双向功能的媒体, 观众可以看,也可以简单地表达自己的观点;③混合宽带广播电视,是第二种媒体融合 了丰富互联网应用的更高级媒体形式,观众可以通过手机APP、微信摇一摇功能、机顶 盒遥控器或PC终端主动参与节目互动,充分表达观点,节目播出机构可以通过数据回传 通道了解节目的收视及观众的喜好情况。 从生产平台层面来看,融合之前的电台与电视台等传统媒体有独立的采、编、播体 系,新媒体也有独立的采、编、播体系,无论是技术系统还是媒体内容,传统媒体和新 媒体的资源都是独立的,缺乏资源共享机制,制约了媒体产品形式的推陈出新。融合之 后,全部媒体可以在统一的技术平台上生产,方便了媒体内容资源的共享,媒体生产和 播出过程中产生的运维、收视、互动数据可通过大数据平台进行挖掘处理,得到的有用 信息反馈到节目生产环节,有利于节目制播的革新。从当前IT技术发展趋势来看,最适 合融合媒体发展的基础技术和设施是云计算、大数据、宽带互联网。 从传播方式层面来看,融媒体改变了传统媒体和新媒体各行其是的节目传播形式, 走向你中有我,我中有你的合作。例如单向广播电视融入了短信、二维码技术、声纹识 别、数字水印等技术,借助互联网回传通道,提高了观众的参与程度,丰富了观众的娱 乐形式,同时提高了广播电视机构的运营和监管能力。 融媒体的主要特征包括媒体信息的交互性、实时性、协同性和集成性。 1. 媒体信息的交互性 由于融媒体时代下多种媒体形式共存,信息的传播者和接受者均可以实现信息的传 递、控制、编辑。融媒体的交互性,不仅能让使用者可按照自己的意愿解决问题,同时 还可借助这种沟通方式来提高工作的效率。这一特点是传统广电媒体所不具备的。 2. 媒体信息的实时性 融媒体下的媒体信息实时性主要是指在人的感官系统允许条件下实现媒体信息的交 互,也就是像面对面一样,音频、影像均实现连续性传播。融媒体实时分布系统融合了 通信网络的分布性、计算机技术的交互性、广播电视媒体的真实性。 3. 媒体信息的协同性 由于各种媒体的传播、发展都具有各自的规律,若要实现多种媒体之间保持协调一 致则需保证各个媒体实现有机地配合。融媒体技术融合了多种媒体传播技术,可在空间、 时间等方面实现多种媒体逐渐协调,由此保证了所有的媒体信息传播协同性的实现。 4. 媒体信息的集成性 融媒体实现了多种媒体的有机集成。在融媒体中,完全覆盖了图像、图形、文本、 语音、视频等多种媒体信息,但“融媒体”体现的不是“跨媒体”时代的媒体间的简单 连接,而是全方位融合——网络媒体与传统媒体乃至通信的全面互动、网络媒体之间的 全面互补、网络媒体自身的全面互融。总之“融媒体”的覆盖面最全,技术手段最全, 媒介载体最全,受众传播面最全。 1.1.3 融媒体分类 融媒体是一个集合的概念,对其分类,可以从多个角度描述。根据媒体的一般属 性,可进行如下分类。 (1)按传播载体类型可分为报纸、杂志、广播、电视、音像、电影、出版、网络、 电信、卫星通信等。 (2)按传播内容所依托的各类技术支持平台可分为下一代广播电视网、宽带通信网 和下一代互联网。 (3)按功能可分为视觉媒体、听觉媒体和视听两用媒体。视觉媒体包括报纸、杂 志、海报、日历、户外广告、橱窗布置、实物和交通等媒体形式。听觉媒体包括无线电 广播、有线广播、宣传车、录音和电话等媒体形式。视听两用媒体主要包括电视、电 影、戏剧、小品及其他表演形式。 (4)按影响范围可分为国际性媒体、全国性媒体和地方性媒体。国际性媒体如卫星 电视传播、面向全球的刊物等。全国性媒体如国家三大台(中央电视台、中央人民广播 电台、中国国际广播电台),全国性报刊等。地方性媒体如省、市电视台、报刊,少数 民族语言、文字的电台、电视台、报刊、杂志等。 (5)按受众类型可分为大众化媒体和专业性媒体。大众化媒体包括报纸、杂志、广 播、电视。专业性媒体包括专业报刊、杂志、专业性说明书等。 (6)按媒体传播信息的时间长短可分为瞬时性媒体、短期性媒体和长期性媒体。瞬 时性媒体如广播、电视、幻灯、电影等。短期性媒体如海报、橱窗、广告牌、报纸等。 长期性媒体如产品说明书、产品包装、厂牌、商标、挂历等。 (7)按传播内容可分为综合性媒体和单一性媒体。综合性媒体指能够同时传播多种 信息内容的媒体,如报纸、杂志、广播、电视等。单一性媒体是指只能传播某一种或某 一方面的信息内容的媒体,如包装、橱窗、霓虹灯等。 根据国际电信联盟(International Telecommunication Union,ITU)电信标准部推出 的ITU-TI.374 建议的定义,可以将媒体划分为感觉媒体、表示媒体、表现媒体、存储媒 体、传输媒体五类。 (1)感觉媒体指的是能直接作用于人们的感觉器官,从而能使人产生直接感觉的媒 体,如文字、数据、声音、图形、图像等。 (2)表示媒体指的是为了传输感觉媒体而人为研究出来的媒体,借助于此种媒体, 能有效地存储感觉媒体或将感觉媒体从一个地方传送到另一个地方,如语言编码、电报 码、条形码等。 (3)表现媒体指的是用于通信中使电信号和感觉媒体之间产生转换用的媒体,如输 入输出设备,包括键盘、鼠标、显示器、打印机等。 (4)存储媒体指的是用于存放表示媒体的媒体,如纸张、磁带、磁盘、光盘等。 (5)传输媒体指的是用于传输某种媒体的物理媒体,如双绞线、电缆、光纤等。 1.1.4 融媒体技术及发展趋势 融媒体技术是指用于融媒体内容采集、存储、制作、播出、分发、传输、接收等各 环节各种技术的统称,涉及计算机应用技术、通信技术、信息与网络技术等,其技术体 系错综复杂,因其应用于媒体,故其与媒体的传播属性、业务流程息息相关。 融媒体技术整合了云计算、大数据、互联网等新信息技术应用于传统媒体,加快了 传统媒体生产流程再造,促进了媒体生产的集约化、数字化和智能化。具体来说,融媒 体未来发展趋势表现在如下几个方面。 (1)互联网将起到越来越重要的作用。 (2)数字视频新媒体拥有广阔发展前景和空间。传统媒体向融媒体拓展的一个重 要方向就是包括网络视频、数字电视、手机电视、户外显示屏在内的各种视频媒体。未 来,视频新媒体的发展将催生出更多的内容提供方式和信息服务形式变革,带动整个传 媒业的融媒体发展进程。 (3)媒介融合由浅入深,从“物理变化”趋向“化学变化”。注重多种传播手段 并列应用的全媒体新闻将发展为多种媒体有机结合的融合新闻;各种媒体机构的简单叠 加、组合将发展为真正有利于融合媒介运作的新型机构组织;融媒体记者将与细分专业 记者分工合作;媒介机构也将在新的市场格局中寻找自身的新定位和业务模式,构建适 应融媒体需要的产品体系和传播平台。 (4)随着融媒体进程的不断发展,在融合的同时,各种媒介形态、终端及其生产也 输入设备就是把数据送入计算机的设备,它接受用户的程序和数据,并转换成二进 制代码送入计算机的内存中存储起来,供计算机运行时使用。常见的输入设备有键盘、 鼠标、扫描仪、手写笔等。输出设备就是把经过计算机处理的数据,以人们能够识别的 形式输出的设备。常见的输出设备有显示器、打印机、绘图仪、音箱等。输入/输出设备 就如同人有了眼睛可以看、耳朵可以听、嘴巴可以讲、手可以写字一样,输入输出设备 是计算机与外界沟通的桥梁。 硬盘分区实质上是对硬盘的一种格式化,然后才能使用硬盘来保存各种信息。常见 的分区格式有FAT16 、FAT32 、NTFS。 FAT16 分区格式是MS-DOS和早期的Windows 95 操作系统中最常见的磁盘分区格式, 采用16位的文件分配表,能支持最大为2GB的分区,但每个分区最多只能有65525个簇 (簇是磁盘空间的配置单位)。随着硬盘或分区容量的增大,每个簇所占的空间将越来 越大,从而导致硬盘空间的浪费。 FAT32 分区格式采用32位的文件分配表,使其对磁盘的管理能力大大增强,可以支 持大到2TB(2048GB)的分区。但在Windows 2000 和Windows XP 系统中,由于系统限 制,单个分区最大容量为32GB。FAT32 具有一个优点:在一个不超过8GB的分区中, FAT32 分区格式的每个簇容量都固定为4kB。与FAT16 相比,可以大大地减少磁盘的浪 费,提高磁盘利用率。但由于文件分配表的扩大,运行速度比采用FAT16 格式分区的磁 盘要慢。 NTFS是一个可恢复的文件系统。在NTFS分区上用户很少需要运行磁盘修复程序。 NTFS支持对分区、文件夹和文件的压缩。NTFS采用了更小的簇,可以更有效率地管理 磁盘空间。NTFS分区格式的优点是安全性和稳定性极其出色,在使用过程中不易产生文 件碎片。 2. 软件系统 计算机的软件分为系统软件、支撑软件和应用软件。系统软件由操作系统、实用程 序、编译程序等组成。操作系统对各种软硬件资源实施管理与控制。实用程序是指具有 特定功能的软件,如文本编辑软件等。支撑软件有接口软件、工具软件、环境数据库 等,它能支持用机的环境,提供软件研制工具。支撑软件也可认为是系统软件的一部 分。应用软件是用户按其需要自行编写或购买的专用程序,它借助系统软件和支撑软件 来运行,是软件系统的最外层。 计算机的硬件是载体,软件是灵魂。软件可以理解为可运行的思想和内容的数字 化,各个领域都有自己专用的软件,所以是各不相同的;而硬件都有相同的特征或者功 能,完成对信息的处理、传输、存储。计算机的价值主要体现在软件,软件的核心是算 法,一个好的算法可以优化硬件资源。硬件与软件在功能上可以相互补充和部分替代; 具有软件功能、硬件形态的部件称为固件。图1-3所示为计算机组成示意图。 计算机组成 软件系统 系统软件 应用软件 固件 硬件系统 外设 输出设备 主机 存储器 CPU 运算器 控制器 输入设备 电源 图1-3 计算机组成示意图 1.2.2 计算机网络相关概念 计算机网络是将地理位置不同,且有独立功能的多个计算机(主机)系统利用通信 设备和线路(通信子网)互相连接起来,辅以功能完善的网络软件(协议)实现网络资 源共享和信息传递的系统。计算机网络向用户提供的最重要的功能有两个,即连通性和 共享性。 (1)连通性是指计算机网络使上网用户之间都可以交换信息,好像这些用户的计算 机都可以彼此直接连通一样。 (2)共享性即资源共享,可以是信息共享、软件共享,也可以是硬件共享。 (3)C/S(Client/Server)结构即客户端/服务器结构。C/S 结构也可以看作是胖客 户端结构,因为在客户端需要实现绝大多数的业务逻辑和界面展示。在这种结构中,作 为客户端的部分需要承受很大的压力。 (4)B/S(Browser/Server)结构即浏览器/服务器结构。它是随着因特网技术的兴 起,对C/S结构的一种变化或者改进的结构。在这种结构下,用户工作界面通过WWW浏 览器来实现,把极少部分的事务逻辑在前端实现。 (5)网关是在采用不同体系结构或协议的网络之间进行互通时,用于提供协议转 换、路由选择、数据交换等网络兼容功能的设施。 (6)局域网(Local Area Network,LAN),是在一个局部的地理范围内,将各种计 算机、外部设备和数据库等互相连接起来组成的计算机通信网。 (7)虚拟局域网(Virtual Local Area Network,VLAN)是一种将局域网设备从逻辑 上划分(注意,不是从物理上划分)成一个个网段,从而实现虚拟工作组的新兴数据交 换技术。 (8)网络地址转换(Network Address Translation,NAT)属接入广域网(WAN)技 术,是一种将私有地址转化为合法IP地址的转换技术,它被广泛应用于各种类型因特网 接入方式和各种类型的网络中。NAT不仅完美地解决了IP地址不足的问题,而且还能够 有效地避免来自网络外部的攻击,隐藏并保护网络内部的计算机。 1.2.3 互联网、因特网和万维网 互联网、因特网和万维网都是指网络的互联,是必须分清的三个概念。 1. 互联网 互联网(internet ,首字母i小写)是指将两台计算机或者是两台以上的计算机终端、 客户端、服务端通过计算机信息技术的手段互相联系起来的结果,以便人们可以与远在 千里之外的朋友相互发送邮件、共同完成一项工作、共同娱乐等。 2. 因特网 因特网(Internet,首字母I大写)是一个以TCP/IP网络协议连接各个国家、地区、 机构的计算机网络的数据通信网。它将数万个计算机网络、数千万台主机互连在一起, 覆盖全球,是全球最大的一个电子计算机互联网,也称“国际互联网”。它的前身就是 1969年12月开通的ARPANET (阿帕网,美国国防部研究计划署)它是一个信息资源极其 丰富的计算机互联网络。 3. 万维网 万维网英文为World Wide Web ,缩写为WWW。只要应用层使用的是HTTP协议的因 特网,就称为万维网。 互联网包含因特网,因特网包含万维网,凡是能彼此通信的设备组成的网络就叫互 联网。所以,即使仅有两台机器,不论用何种技术使其彼此通信,也叫互联网。因特网 是由上千万台设备组成的互联网,它使用TCP/IP协议让不同的设备可以彼此通信。但使 用TCP/IP协议的网络并不一定是因特网,一个局域网也可以使用TCP/IP协议。 1.2.4 因特网的主要特性 因特网的主要特性主要表现为以下几个方面。 (1)因特网采用分组交换技术。 分组交换技术(Packet switching technology )也称包交换技术,是将用户传送的数据 划分成一定长度的部分,每个部分叫做一个分组,通过传输分组的方式传输信息的一种 技术。每个分组的前面有一个分组头,用以指明该分组发往何处的地址,然后由交换机 根据每个分组的地址标志,将他们转发至目的地,这一过程称为分组交换。 (2)因特网使用TCP/IP协议。 TCP/IP是Transmission Control Protocol/Internet Protocol的简写,中译名为传输控制 协议/因特网互联协议,又名网络通信协议,是因特网最基本的协议,也是国际互联网络 的基础,由网络层的IP 协议和传输层的TCP协议组成。TCP/IP 定义了电子设备如何连入 因特网,以及数据如何在它们之间传输的标准。该协议采用了4层的层级结构,上一层呼 叫它的下一层所提供的协议来完成自己的需求。通俗而言:TCP负责发现传输的问题, 一有问题就发出信号,要求重新传输,直到所有数据安全、正确地传输到目的地。而IP 是给因特网的每一台联网设备规定一个地址。 (3)因特网通过路由器将各个网络互联起来。 交换机将各个电脑连起来组成局域网,路由器将各个交换机连起来,也就是将局域 网连起来,组成城域网、广域网。 (4)因特网上的每台计算机都必须给定一个唯一的IP地址。 1.2.5 因特网构成 众所周知,因特网是一个十分复杂的网络,可从下述两方面认识它。 1. 因特网逻辑结构 从网络设计者的角度考虑,因特网是由分布在世界各地的计算机网络相互连接而成 的全球性的互联网络;从使用者的角度考虑,它是一个信息资源网,图1-4所示为因特网 逻辑结构。 网络3网络2 网络1 主机主机 主机 主机 主机 主机 通信子网 Internet 路由器 路由器 路由器 图1-4 因特网逻辑结构 因特网是由大量主机通过连接在单一、无缝的通信系统上而形成的一个全球范围的 信息资源网,接入因特网的主机既可以是信息资源及服务的提供者(服务器),也可以 是信息资源及服务的消费者(客户机)。 2. 因特网组成 因特网由硬件和软件两大部分组成。 (1)硬件部分主要包括通信线路、路由器和主机等设备。 ● 通信线路主要包括有线线路和无线线路两类,通常用“数据传输速率”和“带 宽”来衡量通信线路的传输能力; ● 路由器负责路由选择和存储转发,是因特网中最为重要的设备; ● 服务器与客户机:服务器统称为“主机”,是信息的提供者,客户机是信息的消费者。 (2)软件部分主要是指信息资源。信息资源主要包括文本、声音、图像或视频等 类型。 12 融媒体技术 1.2.6 因特网的接入方式 因特网的接入按传输介质的不同可以分为电缆接入、光纤接入以及无线接入。 1. 电缆接入 1)通过电话网拨号接入 用户计算机和ISP(Internet Service Provider ,因特网服务供应商)的远程访问服务器 RAS(Remote access servers )通过调制解调器(Modem ,俗称“猫”)与电话网相连, 如图1-5(a)所示。 拨号上网是以前使用最广泛的因特网接入方式,主要有两种:个人电脑经过调制 解调器,电话线和公用电话网连接,网络传输速率较低,网络传输速率最高为56kbps, 且上网过程中不能接打电话;另一种采用ISDN 方式,即窄带综合业务数字网,如图1-5 (b)所示。该方式与综合业务数字网连接,信息传输能力较强,网络传输速率最高可达 128kbps,且电话线路不受影响。这两种方式由于网络传输速率较低和费用的原因,已经 快被淘汰了。 因特网ISDNISDN路由器 用户 ISDN适配器 局域网 (a)56k调制解调器(b)电话网拨号接入系统图 图1-5 电话网拨号接入 2)利用ADSL接入 ADSL(Asymmetric Digital Subscriber Line ,非对称数字用户线路)是目前常用的一 种因特网接入方式,如图1-6所示。 进户线 分离器 电话线 网线 Line ADSL ADSL Modem Phone 图1-6 ADSL接入 ADSL的非对称性表现在交换局端到用户端(ADSL调制解调器)的下行速率和用 户端到交换局端的上行速率不同。高速下行信道向用户传送数据、视频、音频信息及控 制、开销信号,在5km的范围内速率一般在1.5 Mbps ~9Mbps,低速上行信道包括通向网 络的控制开销信号,速率一般在16kbps~640kbps。 ADSL需要的电话线资源分布广泛,具有传输速率高、使用费用低、无须重新布线和 建设周期短的特点。 3)混合光纤同轴电缆接入 混合光纤同轴电缆(Hybrid Fiber-Coaxial,HFC)是广电有线网络经常采用的一种 接入方式,它采用非对称的数据传输速率,下行速率要大于上行速率。上行速率一般在 120Mbps左右,下行速率一般在800Mbps到1000Mbps之间,典型的如图1-7所示。 交换机 因特网 分离器 LANCable Modem 光纤同轴混合网 TVCable Modem 图1-7 HFC接入系统图 HFC接入的特点是速率高,且接入主机可以24小时在线。HFC接入的缺点是它采用 共享式的传输方式,HFC网上的用户越多,每个用户实际可使用的带宽就越窄。 4)局域网接入 局域网通过路由器或Modem接入到因特网,通过代理服务器可以满足局域网中每个 用户接入因特网的需求,如图1-8所示。用户通过代理服务器上网还可以隐藏自己,不用 直接与目标机器打交道,提高了上网安全性。 因特网 路由设备或MODEM 局域网 代理服务器 图1-8 局域网接入系统图 2. 光纤接入 光纤接入是指局端与用户之间完全以光纤作为传输媒体,如图1-9所示。光纤接入可 以分为有源光接入和无源光接入。光纤用户网的主要技术是光纤传输技术。根据光纤深 14 融媒体技术 入用户区域的程度,可分为光纤到路边(Fiber-To-The-Curb,FTTC)、光纤到楼(Fiber to The Building,FTTB)、光纤直接到家庭(Fiber To The Home,FTTH)等。 入户光纤 光缆 电话线 网线 ONUPhoneLAN 图1-9 光纤接入 光纤通信不同于有线电通信,后者是利用金属媒体传输信号,光纤通信则是利用透 明的光纤传输光波。虽然光和电都是电磁波,但频率范围相差很大。一般通信电缆最高 使用频率约为107Hz,光纤工作频率在1014 ~1015Hz之间。因此光纤接入能够向用户提供 100Mbps~1000Mbps的高速带宽,可直接汇接到CHINANET骨干结点。主要适用于因特 网高速互联。 3. 无线接入 无线接入包括3G/4G接入和通过WiFi 接入。 1)3G/4G接入 使用具备3G/4G功能的移动电话接入到因特网,下载资料和通话是可以同时进行 的。3G/4G具有实时在线、按流量计费、快捷登录、高速传输、自如切换等优点,是移 动电话接入因特网的主要技术之一,如图1-10所示。 在用户车里 陆地电话线 行驶几公里后 蜂窝电话塔 本地电话公司 中心局 局域网服务 提供商 网络服务 提供商 蜂窝电话塔 因特网 因特网 主机 图1-10 3G/4G接入 2)WiFi接入 用户在接入网络的计算机中安装无线网卡,通过接入访问点连接网络,实现数据共 享、因特网接入等功能,如图1-11所示。 1203 图1-11 WiFi接入 1.2.7 IPv4协议 1. OSI七层模型 OSI七层模型从下到上分别为物理层、数据链路层、网络层、传输层、会话层、表示 层和应用层。 (1)物理层:定义了为建立、维护和拆除物理链路所需的机械的、电气的、功能的 和规程的特性,其作用是使原始的数据比特流能在物理媒体上传输。 (2)数据链路层:在物理层提供比特流服务的基础上,建立相邻结点之间的数据链 路,通过差错控制提供数据帧(Frame)在信道上无差错的传输,并完成各电路上的动作 序列。 (3)网络层:在计算机网络中进行通信的两台计算机之间可能会经过很多个数据 链路,也可能还要经过很多通信子网。网络层的任务就是选择合适的网间路由和交换结 点,确保数据及时传送。 (4)传输层:是两台计算机经过网络进行数据通信时,第一个端到端的层次,具 有缓冲作用。当网络层服务质量不能满足要求时,它将服务加以提高,以满足高层的要 求;当网络层服务质量较好时,它只用很少的工作。 (5)会话层:其主要功能是组织和同步不同的主机上各种进程间的通信(也称为对 话)。会话层负责在两个会话层实体之间进行对话连接的建立和拆除。 (6)表示层:为上层用户提供共同的数据或信息的语法表示和变换。即提供格式化 的表示和转换数据服务。数据的压缩和解压缩,加密和解密等工作都由表示层负责。 16 融媒体技术 (7)应用层:是开放系统互连环境的最高层,为操作系统或网络应用程序提供访问 网络服务的接口。应用层协议包括:Telnet 、FTP、HTTP、SNMP等。 2. TCP/IP层次模型 TCP/IP的层次模型分为四层。 (1)TCP/IP的最高层相当于OSI七层模型的5~7层,该层中包括了所有的高层 协议,如常见的文件传输协议FTP、电子邮件SMTP、域名系统DNS、网络管理协议 SNMP、访问WWW的超文本传输协议HTTP等。 (2)TCP/IP的次高层相当于OSI七层模型的传输层,该层负责在源主机和目的主 机之间提供端到端的数据传输服务。在这一层中主要定义了两个协议:面向连接的传输 控制协议TCP 和无连接的用户数据报协议UDP。相对于IP 协议,UDP唯一增加的功能是 提供协议端口以保证进程通信。许多基于UDP的应用程序在局域网上运行的很好,而一 旦到了通信质量较低的互联网环境下,可能根本无法运行,原因就在于UDP不可靠。因 此,基于UDP的应用程序必须自己解决可靠性。UDP的优点在于其高效率。因为UDP没 有连接过程,对传输不作确认,因此一些对效率要求较高,传输数据量特别小的应用, 或者数据量大但是传输信道质量好(如光纤信道),UDP使用的较多。 (3)TCP/IP的第二层相当于OSI七层模型的网络层,该层负责将分组独立地从信源 传送到信宿,主要解决路由选择、阻塞控制级网际互联问题。在这一层中定义了互联网 协议IP、地址转换协议ARP、反向地址转换协议RARP和互联网控制报文协议ICMP等 协议。 (4)TCP/IP的最低层为网络接口层,该层负责将IP分组封装成适合在物理网络上 传输的帧格式并发送出去,或将从物理网络接收到的帧卸装并取IP分组递交給高层。这 一层与物理网络的具体实现有关,自身并无专用的协议。网络接口层涉及到在通信信道 上传输的原始比特流,它提供传输数据所需要的机械、电气性能和过程等手段,提供检 错、纠错、同步等措施,使之对网络层显现一条无错线路;并且进行流量调控。TCP/IP 协议族如图1-12所示。 网络接口层 TelnetFTPICMPIPARPRARPSMTPTCPUDPDNSTFTP 图1-12 TCP/IP协议族 3. IPv4编址 网际协议(IP)的规范是在1982年发布的文件名为RFC791 。该规范规定了IP地址的 结构,为每个主机和路由器接口提供32位的二进制逻辑地址。 为方便书写及记忆,一个IP地址通常采用用0~255之间的4个十进制数表示,数与数 之间用点分开。每一个十进制数都代表32位地址中的八位,即所谓的八位位组,称为点 分表示法。 按照原来的定义,IP寻址标准并没有提供地址类,为了便于管理后来加入了地址类 的定义。将地址空间分解为数量有限的特大型网络(A类),数量较多的中等网络(B 类)和数量非常多的小型网络(C类),每类均规定了网络标识和主机标识在32位中所 占的范围。这三类IP地址的表示范围分别为: A类地址:0.0.0.0~127.255.255.255 B类地址:128.0.0.0~191.255.255.255 C类地址:192.0.0.0~223.255.255.255 另外,还定义了特殊的地址类,D类(用于多点传送)和E类,通常用于试验或研 究类。 D类地址:224.0.0.1~239.255.255.254 D类地址第一个字节以“1110”开始,用于多点播送,D类地址称为组播地址,供特 殊协议向选定的节点发送信息时用。这些地址并不用于标准的IP地址。相反,D类地址 指一组主机,这些主机作为多点传送小组的成员而注册,多点传送小组和电子邮件分配 列表类似。 E类地址,如果第1个八位位组的前4位都设置为1111,则表示该地址是一个E类地 址。E类地址的范围为240~254,这类地址并不用于传统的IP地址。这个地址类有时候用 于实验室或研究。 IP地址分为公有地址和私有地址。公有地址由世界各大地区的权威机构InterNIC(Internet Network Information Center)负责管理和分配,这些IP地址分配给注册并向 InterNIC提出申请的组织机构。私有地址(Private address)属于非注册地址,专门为组 织机构内部使用,以下列出保留的内部私有地址: A类 10.0.0.0~10.255.255.255 B类 172.16.0.0~172.31.255.255 C类 192.168.0.0~192.168.255.255 子网掩码是在IP地址的某个网络标识中,可以包含大量的主机(如A类地址的主机标 识域为24位、B类地址的主机标识域为16位),而在实际应用中不可能将这么多的主机 连接到单一的网络中,这将给网络寻址和管理带来不便。为解决这个问题,可以在网络 中引入“子网”的概念。 将主机标识域进一步划分为子网标识和子网主机标识,通过灵活定义子网标识域的 位数,可以控制每个子网的规模。将一个大型网络划分为若干个既相对独立又相互联系 的子网后,网络内部各子网便可独立寻址和管理,各子网间通过跨子网的路由器连接, 这样也提高了网络的安全性。 子网掩码中的二进制位构成了一个过滤器,利用子网掩码可以判断两台主机是否在 同一子网中。子网掩码与IP地址一样也是32位二进制数,不同的是它的子网主机标识部 分为全“0”。若两台主机的IP 地址分别与它们的子网掩码相“与”后的结果相同,则说 明这两台主机在同一网中。 MAC(Medium/Media Access Control )地址,是厂商生产的网络设备的物理地址, 对于每一台设备是唯一的,该地址定义了计算机间的网络连接,通常记录在网络接口卡 上的硬件上。 ARP即地址解析协议,其任务是把IP地址转化成物理地址,这样做,就消除了应用 程序需要知道物理地址的必要性。 MAC地址绑定可以防止内部IP地址被非法盗用,增强网络安全。当绑定机器要发送 数据包的时候,接收数据包的设备如果检测到IP与对应的MAC地址不相符就会自动丢弃 该数据包。 网络层设备(例如路由器等)使用网络地址来代表本网段内的主机,大大减少了路 由器的路由表条目。 带子网划分的编址。对于没有子网的 IP 地址组织,外部将该组织看作单一网络,不 需要知道内部结构。例如,所有到地址 172.16.X.X 的路由被认为同一方向,不考虑地址 的第3和第4个八位分组,这种方案的好处是减少路由表的项目。但这种方案没办法区分 一个大的网络内不同的子网网段,这使网络内所有主机都能收到在该网络内的广播,会 降低网络的性能,另外也不利于管理。 1.2.8 IPv6协议 1. IPv6协议的产生 IPv6是互联网工程任务组(Internet Engineering Task Force,IETF)设计的用于替代 现行的IP协议IPv4的下一代IP协议,IPv6的地址由128位二进制数表示。IPv4使用了32位 地址,理论上可以容纳43亿个不同的地址。但采用A、B、C三类编址方式后,可用的网 络地址和主机地址的数目大打折扣,以至IP地址已于2011 年2月3日就分配完毕。对于IP 地址的分配,其中北美占3/4,约30亿个,而人口最多的亚洲只有不到4亿个,自2011 年 开始我国IPv4地址总数基本维持不变。中国互联网络信息中心(CNNIC )发布《第37次 中国互联网络发展状况统计报告》指出,截至2015年12月,我国IPv4的地址数量为3.37 亿个,拥有IPv6地址20594块/32。IP地址不足,严重地制约了中国及其他国家互联网的 应用和发展。要解决 IP 地址耗尽的问题有3个措施。 (1)采用无类别域间路由编址(Classless Inter-Domain Routing,CIDR),使 IP 地 址的分配更加合理。 (2)采用网络地址转换 NAT 方法以节省全球的IP地址。 (3)采用具有更大地址空间的新版本的 IP 协议 IPv6。 IPv4是一个非连接的协议,即独立地传输每个信息分组报文,报文中指定起始地址 和目的地址,其目标是尽力传送每个分组报文。每个分组报文既没有标记为属于哪个 流,或哪个连接,也没有进行编号。尽力传送的非连接的IPV4协议的优点是实现容易, 开销小,缺点是难以有效地支持服务质量(Quality of Service,QoS)。为了克服IPv4这 些缺点,在IPv6中,网际协议修改了很多。 (1)IPv6采用128位编码,相对于IPv4,增加了296倍的地址空间。按保守方法估算 IPv6实际可分配的地址,整个地球的每平方米面积上仍可分配1000多个地址。这样几乎 可以不受限制地提供IP地址,从而确保了端到端连接的可能性。表1-1给出IPv4和IPv6的 可用地址空间。与IPv4一样,IPv6一样会造成一定数量的IP地址浪费,因此准确地说, 使用IPv6的网络并没有2128-1个能充分利用的地址。 表1-1 IPv4和IPv6的可用地址空间 IP版本 可用地址空间 IPv4 4,294,967,296 IPv6 340,282,366,920,938,463,607,431,768,211,456 如果说IPv4实现的只是人机对话,那么IPv6则扩展到任意事物之间的对话。IPv6不仅 可以为人类服务,还将服务于众多的硬件设备,它将是无时不在,无处不在的深入社会 每个角落实现物联网的核心技术之一。 (2)IPv6使用更小的路由表。IPv6的地址分配一开始就遵循聚类(Aggregation)的 原则,这使得路由器能在路由表中用一条记录(Entry)表示一片子网,大大减小了路由 器中路由表的长度,提高了路由器转发数据包的速度。 (3)IPv6增加了增强的组播(Multicast)支持以及对流的支持(Flow Control),这 使得网络上的多媒体应用有了长足发展的机会,为服务质量(QoS)控制提供了良好的 网络平台。 (4)IPv6加入了对自动配置(Auto Configuration)的支持。这是对DHCP协议的改 进和扩展,使得网络(尤其是局域网)的管理更加方便和快捷。 (5)IPv6具有更高的安全性。在使用IPv6网络中用户可以对网络层的数据进行加密 并对IP报文进行校验,极大的增强了网络的安全性。 (6)IPv6支持长期演进。 2. IPv6编址 1)地址表达方式 IPv6采用128位二进制数来表示一个IP地址,IPv6中取消了广播地址。 IPv6地址用X:X:X:X:X:X:X:X来表示,其中X是一个4位十六进制数。由于地址太 长,IPv6地址允许用“空隙”来表示一长串零,也称为零压缩(zero compression)法, 即一连串连续的零可以用一对冒号来代表。如2000:0:0:0:0:0:0:1等同于2000: :1;再如 0:0:0:0:0:0:128.10.2.1可用::128.10.2.1来表示。 2)地址种类 IPv6 数据报的目的地址可以是以下三种基本类型地址之一:单播(unicast),就是 传统的点对点通信;多播(multicast ),是一点对多点的通信;任播(anycast ),这是 IPv6 增加的一种类型,任播的目的站是一组计算机,但数据报在交付时只交付其中的一 个,通常是距离最近的一个。IPv6 将实现 IPv6 的主机和路由器均称为“结点”。IPv6 地址是分配给结点上面的接口,一个接口可以有多个单播地址。一个结点接口的单播地 址可用来唯一地标志该结点。IPv6 将128 位地址空间分为两大部分:第一部分是可变长 度的类型前缀,它相当于IPv4地址中的网络地址。第二部分是地址的其余部分,其长度 也是可变的,标识单个接口或一组接口,如图1-13所示。 128位 类型前缀地址的其他部分 长度可变长度可变 图1-13 IPv6地址空间分配 内嵌IPv4地址格式。为了实现与IPv4的兼容,便于IPv4升级和平滑过渡,IPv6定义了 内嵌IPv4的地址格式。前缀为0000 0000是保留一小部分地址与 IPv4 兼容的,这是因为必 须要考虑到在比较长的时期内IPv4和IPv6将会同时存在,而有的结点不支持 IPv6。因此 数据报在这两类结点之间转发时,就必须进行地址的转换,如图1-14所示。 0000............0000 80位 FFFF 16位 IPv4地址 32位 图1-14 IPv4映射的IPv6地址 1.2.9 IPv4向IPv6过渡 IPv4嵌入到TCP/IP组件的许多层和许多应用程序中。如果实现到IPv6的切换,那么 使用IP的各个应用、驱动程序和TCP 栈不得不进行改变。这会涉及到成百上千的变化, 牵扯到数以百万行代码的改动。这么多的生产商。不可能在一个特定的时间范围内改 变它们的代码。这也意味着IPv4和IPv6必定会共存相当—段时间。IETF 已经设计了三种 策略使过渡时期更加平滑,分别是双协议栈、隧道技术与首部转换。IETF推荐,在所 有的主机完全过渡到IPv6之前,要使用双协议栈。换言之,一个站点必须同时运行IPv4 和IPv6,直到整个的因特网都使用IPv6。当两个使用IPv6的计算机彼此要通信,但其分 组要通过使用IPv4的区域时,就要使用隧道技术这种策略。要通过这样的区域,分组就 必须具有IPv4地址,因此当进入这种区域时IPv6分组要封装成IPv4分组,而当分组离开 这个区域时再去掉这个封装,为了清楚地表示IPv4分组携带了IPv6分组,其协议值被置 为41。当因特网的大部分系统已经过渡到IPv6但某些系统仍使用IPv4时,首部转换就成 为必要的。发送端希望使用IPv6,但接收端不能识别IPv6,这种情况使隧道技术无法工 作,因为这个分组必须是IPv4格式才能被接收端识别。 Twitter 发送1.99亿条微博,3.44亿条消息;每天在Facebook发出40亿条信息。 ● Variety(多样性)。大数据是由结构化和非结构化的数据组成,其中有10%的结 构化数据,和90% 的非结构化数据。它们与人类信息密切相关,非结构化数据类 型多样,主要有:邮件、视频、微博 ; 位置信息、链接信息;手机呼叫、网页点 击以及长微博等。 ● Veracity(真实性)。价值密度低,商业价值高。以视频为例,在连续不间断地监 控过程中,可能有用的数据仅仅有一两秒,但是却具有很高的商业价值。 1.4.2 数据存储单位的换算 数据的最小基本单位是Byte,按顺序给出所有单位:Byte、kB、MB、GB、TB、 PB、EB、ZB、YB、NB、DB。它们按照进率1024(2的10次方)来计算。 1 Byte = 8 bit 1 KB = 1 024 Bytes 1 MB = 1 024 kB = 1 048 576 Bytes 1 GB = 1 024 MB = 1 048 576 KB 1 TB = 1 024 GB = 1 048 576 MB 1 PB = 1 024 TB = 1 048 576 GB 1 EB = 1 024 PB = 1 048 576 TB 1 ZB = 1 024 EB = 1 048 576 PB 1 YB = 1 024 ZB = 1 048 576 EB 1 NB = 1 024 YB = 1 048 576 ZB 1 DB = 1 024 NB = 1 048 576 YB 1.4.3 大数据产业市场主体 大数据产业市场主体主要有互联网企业、传统IT生产商和大数据新兴企业三大类。 在我国目前互联网企业主要以阿里、腾讯、百度为代表,传统IT生产商主要以华为、联 想、中兴、浪潮、曙光等为代表,大数据新兴企业主要代表为亿赞普、拓尔思和海量数 据等。图1-18所示为大数据产业市场主体之间的关系。 以阿里巴巴、腾讯、百度为代表的互联网企业 以华为、联想、浪潮、曙光、 用友等为代表的传统IT厂商 以亿赞普、拓尔思、海量数据等 为代表的大数据新兴企业 图1-18 大数据产业市场主体之间的关系 1.4.4 大数据的特点 大数据的特点主要表现在以下几个方面。 ● 多源异构:描述同一主题的数据由不同的用户、不同的网站产生。网络数据有多 种不同的呈现形式,如音视频、图片、文本等,导致网络数据格式上的异构性。 ● 交互性:不同于测量和传感获取的大规模科学数据,微博等社交网络的兴起导致 大量网络数据具有很强的交互性。 ● 时效性:在网络平台上,每时每刻都有大量新的网络数据发布,网络信息内容不 断变化,导致了信息传播的时序相关性。 ● 社会性:网络上用户根据自己的需要和喜好发布、回复或转发信息,因而网络数 据成了对社会状态的直接反映。 ● 突发性:有些信息在传播过程中会在短时间内引起大量新的网络数据与信息的产 生,并使相关的网络用户形成网络群体,体现出网络大数据以及网络群体的突发 特性。 ● 高噪声:网络数据来自于众多不同的网络用户,具有很高的噪声。 1.4.5 大数据技术 大数据需要特殊的技术,主要包括大规模并行处理(MPP)数据库、数据挖掘网 络、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。 大数据技术分为整体技术和关键技术两个方面。 1. 整体技术 整体技术主要有数据采集、数据存取、基础架构、数据处理、统计分析、数据挖 掘、模型预测和结果呈现等。 2. 关键技术 大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、 大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大 数据安全等)。 (1)大数据采集技术:数据采集是通过RFID射频技术、传感器以及移动互联网等 方式获得的各种类型的结构化及非结构化的海量数据。大数据采集一般分为大数据智能 感知层和基础支撑层: ● 大数据智能感知层:主要包括数据传感体系、网络通信体系、传感适配体系、智 能识别体系及软硬件资源接入系统。实现对结构化、半结构化、非结构化的海量 数据的智能化识别、定位、跟踪、接入、传输、信号转换、监控、初步处理和管 理等。必须着重攻克针对大数据源的智能识别、感知、适配、传输、接入等技术。 ● 基础支撑层:提供大数据服务平台所需的虚拟服务器,结构化、半结构化及非结 构化数据的数据库及物联网络资源等基础支撑环境。重点攻克分布式虚拟存储技 术,大数据获取、存储、组织、分析和决策操作的可视化接口技术,大数据的网 络传输与压缩技术,大数据隐私保护技术等。 (2)大数据预处理技术:大数据预处理主要完成对已接收数据的抽取、清洗等 操作。 ● 抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以将这些复杂的 数据转化为单一的或者便于处理的构型,以达到快速分析处理的目的。 ● 清洗:对于大数据,并不全是有价值的,有些数据并不是我们所关心的内容,而 另一些数据则是完全错误的干扰项,因此要对数据通过过滤“去噪”从而提取出 有效数据。 (3)大数据存储及管理技术:大数据存储与管理要用存储器把采集到的数据存储 起来,建立相应的数据库,并进行管理和调用。要解决大数据的可存储、可表示、可处 理、可靠性及有效传输等几个关键问题。 (4)大数据分析及挖掘技术:数据分析及挖掘技术是大数据的核心技术。主要是 在现有的数据上进行基于各种预测和分析的计算,从而起到预测的效果,满足一些高 级别数据分析的需求。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机 的实际数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的 过程。 (5)数据展现和应用:大数据技术能够将隐藏于海量数据中的信息挖掘出来,从而 提高各个领域的运行效率。在我国,大数据重点应用于以下三大领域:商业智能、政府 决策和公共服务。 1.4.6 大数据的媒体应用 大数据在媒体中的应用,主要有以下几种方式。 1. 大数据可能改变新闻采编方式 记者只要在采访过程中随时录下所需的音频数据,并且在音频数据末尾输入特殊的 “符号”。其后通过专业的数据抓取平台提取相关数据并加以分析,由计算机后台按照 一定的编写模式撰写稿件,在得到记者确认后提交给稿件库。 2. 大数据挖掘提升媒体信息的二次价值 所谓二次价值主要涉及两方面:其一,指对数据的重复使用所能产生的额外的经济 效益;其二,指在对数据的二次利用过程中产生的对整个媒体的战略布局等产生深刻影 响的作用。 信息的二次利用最易产生经济利益的方式就是授权其他媒体进行转发,但在目前知 识产权保护不完善的情况下,这种二次利用的价值不高。信息二次利用的真正价值在于 通过对庞大的数据进行分析、整合,从而预测出市场走向。 用户 检测虚拟世界 反馈 建模模块 传感器 控制 现实世界 3D 模型 图1-21 虚拟现实系统的构成 ● 检测模块:检测用户的操作命令,并通过传感器模块作用于虚拟环境。 ● 反馈模块:接受来自传感器模块的信息,为用户提供实时反馈。 ● 传感器模块:一方面接受来自用户的操作命令,将其作用于虚拟环境,另一方面 将操作后产生的结果以相应的反馈形式提供给用户。 ● 控制模块:对传感器进行控制,使其对用户、虚拟环境和现实世界产生作用。 ● 3D模型库:现实世界各组成部分的三维表示,并由此构成对应的虚拟环境。 ● 建模模块:获取现实世界各组成部分的三维数据,并建立它们的三维模型。 2. 实现过程 虚拟现实利用计算机技术生成逼真的、具备视、听、触、嗅、味等多种感知的虚拟 环境。它借助于计算机生成一个三维空间,通过将用户置身于该环境中,借助轻便的多 维输入输出设备(如跟踪器、头盔显示器、眼跟踪器、三维输入设备和传感器等)和高 速图形计算机,并根据由此而产生的一种身临其境的感觉,去感知和研究客观世界的变 化规律。 1.5.4 技术优点 虚拟现实的技术优点主要表现在以下两个方面。 ● 虚拟现实的技术实质在于提供一种高级的人机接口。虚拟现实技术改变了人与计算 机之间枯燥、生硬和被动的现状,给用户提供了一个趋于人性化的虚拟信息空间。 ● 虚拟现实的出现,使人们从纷繁复杂的数据中解放出来,这种形式是传统表现方 式所无法比拟的,它给人们提供了一个崭新的信息交流平台。 1.5.5 支撑技术 虚拟现实的支撑技术有计算机图形学、人工智能、人工交互技术和传感技术。它们 之间的关系如图1-22所示。 ● 计算机图形学是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格 形式的科学。 ● 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应 用系统的一门新的技术科学。 ● 人工交互技术是指通过计算机输入、输出设备,以有效的方式实现人与计算机对 话的技术。 ● 传感技术是关于从自然信源获取信息,并对之进行处理和识别的一门多学科交叉 的现代科学与工程技术。 计算机 图形学 人工交 互技术 虚拟现实 人工智能 传感技术 图1-22 虚拟现实支撑技术之间的关系 1.5.6 关键技术 虚拟现实的关键技术主要涉及下述几个方面。 1. 建模技术 虚拟环境建模的目的在于获取实际三维环境的三维数据,并根据其应用的需要,利 用获取的三维数据建立相应的虚拟环境模型。 虚拟环境的建模是整个虚拟现实系统建立的基础,主要包括三维视觉建模和三维听 觉建模。视觉建模包括几何建模、运动建模、物理建模和对象行为建模。 1)几何建模技术 几何建模描述了虚拟对象的形状(多边形、三角形、顶点和样条)以及它们的外观 (表面纹理、表面光强度和颜色)。 几何模型一般可分为面模型和体模型两类。面模型用面片来表现对象的表面,其基本 几何元素多为三角形;体模型用体素来描述对象的结构,其基本几何元素多为四面体。 几何建模通常采用的方法有人工的几何建模和自动的几何建模方法。人工方法主要 是利用软件进行人工设定和导入,其工作量大,效率低;自动几何建模主要通过三维数 字化仪进行自动扫描,其工作效率相对高,如图1-23所示为使用Polhemus FastScan 3D 扫 描仪自动建立几何建模。 http://t2.baidu.com/it/u=520745502,3796475993&fm=0&gp=0.jpg http://t2.baidu.com/it/u=2954687527,2443394398&fm=0&gp=0.jpg(a)原始状态(b)数据处理后的模型 图1-23 Polhemus FastScan 3D扫描仪自动建立几何建模 完成几何建模后接下来就是照亮场景,使得对象能够看得见。场景的光照可分为局 部光照和整体光照。局部光照常用方法有Gouraud明暗处理和基于法向量插值的Phong明 暗处理。整体光照模型中采用的一种方法是模拟对象的辐射度。 纹理映射是在图形流水线的光栅化阶段执行的一种技术,其目的是更改对象模型的 表面属性,如颜色、漫反射率和像素法向量等。 2)物理建模技术 虚拟现实系统的物理建模是基于物理方法的建模。典型的物理建模方法有分形技术 和粒子系统等。 ● 分形技术可以描述具有自相似特征的数据集。自相似结构可用于复杂的不规则外 形物体的建模。该技术首先被用于河流和山体的地理特征建模。 ● 粒子系统由大量称为粒子的简单体素构成,每个粒子具有位置、速度、颜色和生 命周期等属性,这些属性可根据动力学计算和随机过程得到。粒子系统常用于描 述火焰、水流、雨、雪、旋风、喷泉等现象。 3)运动建模技术 对象位置包括对象的移动、旋转和缩放。在VR中,不仅要设计绝对的坐标系统,还 要涉及每一个对象相对的坐标系统。碰撞检测是VR技术的一个重要技术,在运动建模中 经常使用。 4)对象行为建模技术 对象行为建模是处理物体的运动和行为的描述,使虚拟环境随位置、碰撞、缩放和 表面变形等变化而动态产生的变化。 其建模方法主要有基于数值插值的运动学方法与基于物理的动力学仿真方法。 ● 运动学方法是指通过几何变换如物体的平移和旋转等来描述运动。例如在三维计 算机动画中,常利用插值方法产生中间帧。另一种动画设计方法是用户给定物体 运动的轨迹样条,由样条来驱动动画。 ● 动力学仿真中一个重要的问题是对运动的控制。常见的控制方法有预处理方法与 约束方法。 2. 场景调度技术 场景调度的目标是在不降低场景显示质量的情况下,尽量简化场景物体的表示,以 减少渲染场景的算法时间,降低空间复杂度,并同时减少绘制场景物体所需的设备资源 和处理时间。 ● 基于场景图的管理。场景图是一种将场景中的各种数据以图的形式组织在一起的 场景数据管理方式。 ● 基于绘制状态的场景管理的基本思路是把场景物体按照绘制状态分类,对于相同 状态的物体只设置一次状态并始终保存当前状态列表。 ● 基于场景包围体的场景组织。对单个物体建立包围体(Bounding Volume),再在 包围体的基础上对场景建立包围盒层次树(Bounding Volume Hierarchy),形成 场景的一种优化表示。 ● 场景绘制的几何剖分技术。几何剖分技术是将场景中几何物体通过层次性机制组 织起来,灵活使用,快速剔除层次树的整个分支,并加速碰撞检测过程。 3. 碰撞检测技术 碰撞检测技术的基本任务是确定两个或多个物体彼此之间是否有接触或穿透,并给 出相交部分的信息。碰撞检测技术是随着人们对场景真实性的要求而逐步发展的,只要 场景中两个物体在移动就必须判断是否会与其他物体相接触。碰撞检测技术分为面向凸 体的碰撞检测、基于一般表示的碰撞检测、基于层次包围体树的碰撞检测和基于图像空 间的碰撞检测。 1)面向凸体的碰撞检测 面向凸体的碰撞检测算法大体又可分为基于特征的碰撞检测算法和基于单纯形的碰 撞检测算法两类。 ● 基于特征的检测算法主要是通过判别两个多面体的顶点、边和面之间的相互关 系,并进行相交检测。所有基于特征的方法基本上都源自于Lin-Ganny算法,但 是该算法无法判断是否刺穿,更不能求出刺穿深度。 ● 面向单纯形的碰撞检测算法又称为GJK 算法,这类算法除了可以检测出两物体是 否相交外,还能返回刺穿深度。 2)基于一般表示的碰撞检测 面向不同的模型表示方法,人们研究出了针对于特定的具体模型的算法,例如CSG 表示模型、面向参数曲面、面向体表示模型等。 3)基于层次包围体树的碰撞检测 物体的层次包围体树可以根据其所采用包围体类型的不同来加以区分,主要包括层 次包围球树、AABB层次树、OBB层次树、k-dop层次树、QuOSPO层次树以及混合层次 包围体树。 4)基于图像空间的碰撞检测 该技术是通过移动图形硬件的剪裁平面,判断平面上的每个像素是否同时在两个实 体之内来确定物体是否相交。 4. 特效技术 常用的特效技术可以分为三大类:过程纹理模型、基于分形(fractal)理论的算法模 型与基于动态随机生长原理的算法模型。 5. 交互技术 传统的人机交互设备仅仅是鼠标键盘,情景不会随着人们的主观意志而转移。随着 科技的发展和人们对人机交互的更高要求,人机交互技术得到了迅猛发展。近年来,数 字头盔、数字手套等复杂传感设备应运而生,为人们带来了意想不到的惊喜。现在我们 可以走进场景,化虚为实,将自己与虚拟场景融为一体。三维交互技术与语音识别、语 音输入技术都成为重要的人机交互手段。 1.5.7 虚拟现实系统的分类 虚拟现实系统可分为增强式虚拟现实系统和分布式虚拟现实系统。 1. 增强式虚拟现实系统 增强式虚拟现实系统是把真实环境和虚拟环境组合在一起的一种系统。它既允许用 户看到真实世界,同时也可以看到叠加在真实世界的虚拟对象。这种系统既可减少对构 成复杂真实环境的计算,又可对实际物体进行操作,真正达到亦真亦幻的境界。图1-24 为增强式虚拟现实系统工作框图。 反馈 虚拟环境 真实环境 操作 实物虚化 人 虚物实化 虚物实化 实物虚化 图1-24 增强式虚拟现实系统系统工作框图 增强式虚拟现实系统的应用领域主要为维修、医学检查、培训等,存在的主要问题 是虚实一致性还不够协调。 2. 分布式虚拟现实系统 分布式虚拟现实系统是利用远程网络,将异地的不同用户联结起来。多个用户通过 网络同时参加到一个虚拟空间中,共同体验虚拟经历。对同一虚拟世界进行观察和操 作,达到协同工作的目的,从而将虚拟现实的应用提升到了一个更高的境界。图1-25为 分布式虚拟现实系统工作框图。 人 虚物实化实物虚化 计算机网络 虚拟环境 真实世界 实物虚化虚物实化 计算机 计算机或机器人 图1-25 分布式虚拟现实系统工作框图 分布式虚拟现实系统具有遥在性,即真实世界与操作人员相隔两地,主要应用领域 为远程手术,远程探测等。 1.5.8 应用领域 虚拟现实技术作为一项新的技术,将对人们的生活、工作产生重大的影响,如飞行 模拟、医学虚拟、战场虚拟等。 1. 飞行模拟 飞行模拟是虚拟现实技术应用的先驱。通过模拟器训练飞行员是一条有效的途径。 同时,飞行模拟器可以作为一种试验床,对飞机的操纵性、稳定性和机动性进行测试和 评定,较容易分析飞机气动参数的修改对飞行品质的影响,图1-26为虚拟现实在航天飞 行中的应用。 7ZX[[R788JW_I[`IZK$ZG`L EPIHIJFCNT%GBUAG1@X$~NY图1-26 飞行模拟场景 2. 医学方面 虚拟现实可以用于教学、复杂手术过程的规划、在手术过程中提供操作和信息上的 辅助、预测手术结果等。此外,远程医疗服务也是一个很有潜力的应用领域。也可以用 于医学心理学,尤其是在与心理失调有关的恐惧和忧虑疾病方面,如图1-27所示。 IMG_256图1-27 虚拟现实应用于医学方面 3. 虚拟战场 虚拟战场既通过建立虚拟战场环境来训练军事人员,同时又可以通过虚拟战场来检 查和评估武器系统的性能,如图1-28所示。 2005115112627621 1265330785343 图1-28 虚拟战场 4. 电影电视 Sid Lee Collective为我们带来了一部特别的电影——11∶57,如图1-29所示。这部电 影很简短,但是,它是一部恐怖题材的虚拟现实电影,给观众带来了不同寻常的体验。 为了拍摄出 360 度的视觉效果,他们特意制作了器材,使用了6台GoPro HERO3+相机。 IMG_256 图1-29 虚拟现实应用于电影电视 5. 娱乐游戏 如家庭中的桌面游戏,公共场所的各种仿真等。目前基于虚拟现实技术的游戏主要 有驾驶型游戏、作战型游戏和智力型游戏三类,如图1-30所示。 IMG_256 图1-30 虚拟现实应用于娱乐游戏 3. 简述融媒体的特征。 4. 什么是融媒体技术? 5. 简述计算机组成。 6. 互联网、因特网和万维网区别和联系? 7. 因特网接入按传输介质可以分为几种? 8. TCP/IP协议可分为哪几层? 9. 什么是云计算? 10. 简述云计算的特点。 11. 云计算的核心技术都有哪些? 12. 简述云计算的核心技术。 13. 什么是大数据?大数据与大量数据的区别? 14. 什么是大数据的4V特点? 15. 什么是虚拟现实? 16. 虚拟现实的关键技术是什么? 的声波叫次声波,高于20kHz的声波叫超声波。次声波和超声波都是人耳听不到的,但 有的动物可以听到。 2. 周期 周期是波振动一次所需的时间,是频率的倒数,记作T,单位为秒(s)。 T=1/f (2-1) 3. 波长 波长是沿声波传播方向,一个振动周期所传播的距离,或在波形上相位相同的相邻 两点间距离,记为λ,单位为m。 波长、周期的在波形图上的关系如图2-4所示。 时间 振幅 波长(λ) 振动周期 (平衡位置) 图2-4 波长、周期在波形图上的关系 4. 声速 声速是声波每秒在介质中传播的距离,记作v,单位为m/s。声速跟介质的反抗平衡 力有关,反抗平衡力越大,声速越快。液体的反抗平衡力要比气体的大,而固体的反抗 平衡力又比液体的大。在15℃空气中声速约为340m/s,在水中声速约为1440m/s,在钢 铁中声速约为5100m/s。 声速还与气压和温度有关。在空气中,声速v和温度t的关系可简写为: v= 331.4+0.607t (2-2) 我们可以近似认为温度每上升/下降5℃,声波的速度上升/下降3m/s。常温25℃下, 声速约为345m/s。 此外声速随物质的坚韧性的增大而增加,随物质的密度减小而减少。 5. 频率、波长和声速之间的关系 频率f、波长λ和声速v三者之间的关系是(如图2-5所示): 102020102510.20.10.0550100200 频率,f [Hz] 波长,λ[m] λλ5001k2k5k10k 图2-5 频率、波长和声速之间的关系 v=λf (2-3) 2.2.2 倍频程 两个声波的频率之比或音调之比用2为底的对数表示称为倍频程,其数学表达式为: n=log2 ff21 (2-4) 式中: f1——参考频率; f2——求倍频程数的信号频率; n——倍频程数,n可正可负,也可以是分数或整数。例如,n=l、1/3,则分别称为 “1倍频程”和“1/3倍频程”。 可闻声的频率高低相差1000倍。为了方便起见,把宽广的声频变化范围划分为若干 较小的段落,叫做频段或频带。两个不同频率的声音作比较时,有决定意义的是两个频 率的比值,而不是它们的差值。例如小提琴相邻空弦的音调高低差是相同的,在音乐中 称作相差“五度音程”,相应的频率比值都是2∶3,也是相同的,但频率差值分别是 98Hz、146Hz和220Hz,相差越来越大;又如C调的la,基音频率是440Hz,高八度la的基 音频率是880Hz,而低八度la的基音频率则是220Hz。从低八度的la提高至la,或从la提高 至高八度la,频率都正好提高一倍,而听起来音调的提高也是相同的。 在声学工程中,倍频程也可理解为与频率作相对比较的单位。两个频率相差1个倍频 程,意味着其频率之比为2∶1;两个频率相差2个倍频程,意味着其频率之比为22∶1,3 个倍频程则为23∶1,依次类推,相差n个倍频程,意味着两个频率之比为2n∶1。在一般 情况下,n不一定是整数,可以是任意的正实数。按倍频程均匀划分频率区间,相当于对 频率按对数关系加以标度。 2.2.3 声功率 声功率是指单位时间内,声波通过垂直于传播方向某指定面积的声能量。在噪声监 测中,声功率是指声源总声功率,单位为W。 声功率级: P LW =lg (dB) (2-5) P0 式中: LW——声功率级(dB) ; P— — 声功率(W) ; P0— — 基准声功率,为10-12 W。 2.2.4 声强 声传播时也伴随着能量的传播,用单位时间内通过垂直于声波传播方向的单位面积 的能量(声波的能量流密度)表示,声强的单位是W/m2。声强的大小与声速成正比,与 声波的频率的平方、振幅的平方成正比。超声波的声强大是因为其频率很高,炸弹爆炸 的声强大是因为振幅大。 2.2.5 声强级 声波的响度主要由声强来决定,声强越大声音就越响,但两者之间并不成正比关 系,一般来说,声强每增加10倍,响度才增加1倍。因此,用声强来说明声音的强度与人 的主观感觉有很大差异。为了使声音的强弱量度能与主观感觉相符,人们规定了另一个 物理量,叫做“声强级”——用对数尺度来表示声音强度的等级,其单位为贝尔(B) 或分贝(dB)。 LI =10lg II0 (dB) (2-6) 式中: LI —— 声压级(dB); I —— 声强(W/m2); I0 —— 基准声强,为10-12 W/m2,听阈所对应的声级被视为0dB。但需注意的是0dB 并不是没有声音,而是可闻声的起点。声强每递增10倍,其声级就增加10dB,意味着人 耳感觉到的强度将增加一倍。 2.2.6 声压 声压是由于声波的存在而引起的压力增值,单位为Pa。声波在空气中传播时形成压 缩和稀疏交替变化,所以压力增值是正负交替的。但通常讲的声压是取均方根值,叫有 效声压,故实际上总是正值,对于球面波和平面波,声压与声强的关系是 I= P2ρυ (2-7) 式中: ρ——空气密度; υ——为声速。 如以标准大气压与20℃的空气密度和声速代入,得到ρυ=408国际单位值,也叫瑞 利。称为空气对声波的特性阻抗。 2.2.7 声压级 声压级以符号SPL表示,其定义为将待测声压有效值Pe与基准声压P0的比值取常用对 强的变化不是简单的线性关系,而是接近于对数关系。当声音的频率、声波的波形改变 时,人对响度大小的感觉也将发生变化,经过研究其变化关系如图2-7所示。 0102030405060 声压级(dB) 7080901001101201301402030406080100200300400 频率(Hz)(kHz) 6008001000234681015 双耳听觉下限 130100908070605040302010 方 120110 图2-7 等响度图 响度的计量单位是宋(sone),定义频率为1kHz,声压级为40dB纯音的响度为1宋。 大多数人对信号声级变化小于3dB时是感觉不出来的,因此对音响系统常以3dB作为 允许的频率响应曲线变化范围。 人耳对声音的感觉,不仅和声压有关,还和频率有关。声压级相同,频率不同的声 音,听起来响亮程度也不同。如空压机与电锯,同是100分贝声压级的噪声,听起来电锯 声要响得多。按人耳对声音的感觉特性,依据声压和频率定出人对声音的主观音响感觉 量,称为响度级,单位为方(phon)。 以频率为1000Hz的纯音作为基准音,其他频率的声音听起来与基准音一样响,该声 音的响度级就等于基准音的声压级,即响度级与声压级是一个概念。例如,某噪声的频 率为100Hz,强度为37dB,其响度与频率为1000Hz,强度为20dB的声音响度相同,则该 噪声的响度级为20方。人耳对于高频噪声是 1000Hz~5000Hz的声音敏感,对低频声音 不敏感。例如,同是40方的响度级,对1000Hz的声音来说,声压级是40dB;4000Hz的声 音,声压级是32dB;100Hz的声音,声压级是52dB;30Hz的声音,声压级是78dB。也就 是说,低频的80dB的声音,听起来和高频的32分贝的声音感觉是一样的。但是声压级在 80分贝以上时,各个频率的声压级与响度级的数值就比较接近了,这表明当声压级较高 时,人耳对各个频率的声音的感觉基本是一样的。 46 融媒体技术 声强与响度是有一定关系的,声强是客观的,决定于单位时间内作用于单位面积上 能量的大小,可以用物理仪器(如声级计)来测量。一定强度的声波作用于人听觉器官 所引起的一种辨别声音强弱的感觉称为响度。响度是主观的,它不仅决定于声音的物理 强度,而且与声音的频率也有一定关系。 2.3.2 音调 声音频率的高低叫做音调,是表示听觉分辨一个声音的调子高低的程度。音调主要 由声音的频率决定,同时也与声音强度有关。对一定强度的纯音,音调随频率的升降而 升降;对一定频率的纯音、低频纯音的音调随声强增加而下降,高频纯音的音调却随强 度增加而上升。 不少专业音响设备都有音调控制功能,其实就是调控频率。音调低,表示振动频率 低,声音显得深沉;音调高,表示振动频率高,声音就尖刺。男声比女声低沉,这是因 为男声的基频较低的缘故。频率每提高一倍,音调将提升八度,即每一倍频程相当于八 度音阶。通常音响设备中的音调控制不是控制设备所产生的频率高低,而是控制设备的 频响,就是对不同音调信号来实现放大或衰减。 2.3.3 音色 音色又名音品,音色(Timbre )是指声音的感觉特性。不同的人声和不同的声响都 能被区分主要源于不同的音色,音色的不同取决于不同的泛音。每一种乐器、不同的人 以及所有能发声的物体发出的声音,除了一个基音外,还由于发声体的材料、结构的不 同,会有许多不同频率(振动的速度)的泛音伴随,正是这些泛音决定了其不同的音 色。因此人们就可以通过这些不同的泛音区分出发声体是钢琴还是黑管,如图2-8所示。 例如即使在同一音高和同一声音强度的情况下,我们也能很容易地区分出是不同乐器, 每一个人即使说相同的话也有不同的音色,因此可以根据其音色辨别出是不同的人。 400010 高压级(dB)208001200160020002400 频率(Hz) 黑管基频100Hz400010 高压级(dB) 208001200160020002400 频率(Hz) 钢琴基频100Hz 图2-8 不同乐器相同基音泛音不同 48 融媒体技术 波,但振动的频率必须在一定的范围内,并且达到一定强度,才能被耳蜗所感受,引起 听觉。在人耳听觉率范围内,对于其中每一种频率,都有一个刚好能引起听觉的最小振 动强度,称为听阈。听阈直接反映了听觉感受器的灵敏程度,听阈越低,表示很小的声 音就能听到,反之,听阈高,表示很大的声音才能听到。 当振动强度在听阈以上继续增加时,听觉的感受也相应增强,但当振动强度增加到 某一限度时,它引起的将不单是听觉,同时还会引起鼓膜的疼痛感觉,这个限度称为最 大可听阈。由于对每一个振动频率都有自己的听阈和最大或听阈,因而就能绘制出表示 人耳对振动频率和强度的感受范围的坐标图,如图2-10所示。其中下方曲线表示不同频 率振动的听阈,上方曲线表示它们的最大听阈,两得所包含的面积则称为听域。凡是人 所能感受的声音,它的频率和强度的坐标都应在听域的范围之内。由听域图可看出,人 耳最敏感的频率在1000Hz~3000Hz 之间;而日常语言的频率较此略低,语音的强度则在 听阈和最大可听阈之间的中等强度处。 12.5 0.0001 50 200 800 3200 12800 0.001 0.01 0.1 1 10 声压(dyn、cm 2 ) Sound pressure 100 1000 10000 最大听阈 Maxium auditory threshold 听阈 Auditory threshold 男低音 男中音 男高音 女中音 女高音 通常的语言区声频(Hz) Frequency (1dyn=105N) 次要的语言区 图2-10 人的正常听域图 2.4.3 掩蔽效应 掩蔽效应指人的耳朵只对最明显的声音反应敏感,而对于不敏感的声音,反应则较 不为敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其 他频率段的声音不敏感了,图2-11 为掩蔽效应的原理图。应用此原理,人们发明了MP3 等压缩的数字音乐格式,在这些格式的文件里,只突出记录了人耳朵较为敏感的中频段 声音,而对于较高和较低的频率的声音则简略记录,从而大大压缩了所需的存储空间。 在人们欣赏音乐时,如果设备对高频响应得比较好,则会使人感到低频响应不好,反之 亦然。 听不见的 声音信号 阈值 掩蔽阈值掩蔽声音 被掩蔽声音 声强/dB0.020204060800.050.10.20.51f/kHz251020 图2-11 掩蔽效应的原理图 人耳的掩蔽效应是一个较为复杂的心理学和生理声学现象,主要表现为频谱掩蔽效 应和时间掩蔽效应。 1. 频谱掩蔽效应 表现为由一种频率的声音阻碍听觉系统感受另一种频率的声音。 人对各种频率可听见最小声级叫绝对可听域,在20 Hz~20 kHz的可听范围内,人耳 对频率3kHz~4kHz附近的声音信号最敏感,对太低和太高频率的声音感觉都很迟钝。 如果有多个频率成分的复杂信号存在,那么绝对可听域曲线取决于各掩蔽音的强 度、频率和它们之间的距离。图2-12(a)是存在多个声音,只能听到掩蔽曲线以上的情 况,图2-12(b)是人耳对各种频率的绝对可听域曲线,将图(a)和图(b)结合就成为 图2-12(c)。低于图2-12(c)曲线的频率成分人就听不见了,当然不必传送了。音频压 缩就是基于这个原理。 fWWffW000(a)(b)(c) (a)多频率掩蔽曲线 (b) 绝对可听域曲线 (c) 全频带掩蔽效应 图2-12 全频带掩蔽效应 2. 时间掩蔽效应 表现为较强声音的存在掩蔽了另一个较弱声音的存在。 时间掩蔽效应分为前掩蔽、同期掩蔽和后掩蔽。在时域内,听到强音之前的短暂时 间内,业已存在的弱音可以被掩蔽而听不到,这种现象称为前掩蔽;当强音和弱音同时 存在时,弱音被强音掩蔽,这种现象称为同期掩蔽;当强音消失后,经过较长的持续时 间,才能重新听到弱音信号,这种现象称为后掩蔽。三种时域掩蔽效应的时间关系如图 2-13所示。 对于电压和电流,由于P=I2R=U2/R,这样用分贝来表示时,系数要乘以20。 2.6.2 电信号的分贝值 电信号也常用分贝作单位。例如某放大器的放大倍数为20dB,电路上某点的电平为 15dBV,调音台的信噪比(信号与同时出现的噪声之比)为80dB等。以下是电信号分贝 值的几种方法: 1)功率放大倍数(dB) 设电路的输入功率为Pi,输出功率为P0,则功率放大倍数为 : l0lgP0/Pi (2-10) 2)功率信噪比(dB) 设电路中某点的信号功率为S,噪声功率为N,则功率信噪比为: l0lgS/N (2-11) 3)功率电平级(dB) 设电路中某点的功率为P,则该点的功率电平级为: l0lgP/Pr(dBm) 式中:Pr为参考功率,Pr=l mW。 4)电压放大倍数(dB) 设电路的输入电压为Ui,输出电压为U0,则电压放大倍数为: 201gU0/Ui (2-12) 5)电压信噪比(dBm,dBu,dBV) 设电路中某点的信号电压为S,噪声电压为N,则功率信噪比为: 20lgS/N (2-13) 6)电压电平级 某一电压U与一基准电压Ur相比求常用对数乘以20表示的值为电压U的电压电 平,即: Lv=20lg U/Ur (2-14) 由于基准电压Ur的取值不同,常用单位有下列三种: ● dBm:在特定的600Ω阻抗条件下,由于1mW电功率在600Ω阻抗上的电压可算得 为0.775V,所以Ur = PR = 0.001 × 600 = 0.775V ,为基准电压所求得的电压电 平值,单位为dBm。这样如某点的电压电平级为20 dBm,则相应电压为7.75 V。 ● dBu:不考虑阻抗是否为600Ω,以Ur等于0.775V为基准电压时所求得的电压电平 值,单位为dBu。 ● dBV:以Ur等于1V为基准电压时所求得的电压电平值,单位为dBV。 2.6.3 声音的分贝值 声音的大小可用声压和声强表示,也可以用其对数表示,即声压级和声强级。 声源 听音人 图2-18 双耳效应 如果声音来自听音者的正前方,此时由于声源到左、右耳的距离相等,从而声波到 达左、右耳的时间差(相位差)、音色差为零,此时感受出声音来自听音者的正前方, 而不是偏向某一侧。当声音强弱不同时,听者可感受出声源与听音者之间的距离。 1. 辨别声源的几个物理因素 1)声音达到两耳的时间差Δt 由于左右两耳之间有一定的距离,因此,除了来自正前方和正后方的声音之外,由 其他方向传来的声音到达两耳的时间就有先后,从而造成时间差。如果声源偏右,则声 音必先到右耳后到达左耳。声源越是偏向一侧,则时间差也越大。实验证明,当声源在 两耳连线上时,时间差约为0.62ms。 对于瞬态声,可以有效地利用时间差来判别声音方位,这时的定位作用取决于声 音传来的最初瞬间。这也是人耳对打击乐器、语言、求救声等瞬态声更易判别方位的 重要原因。对于持续音,由于它们分别先后到达两耳所引起的遮蔽效应,致使定位效果 稍差。 2)声音达到两耳的声级差ΔL 两耳之间的距离虽然很近,但由于头颅对声音的阻隔作用,声音到达两耳的声级就 可能不同。如果声源偏左,则左耳感觉声级大一些,而右耳声级小一些。当声源在两耳 连线上时,声级差可达到25dB左右。 3)声音到达两耳相位差Δφ 声音是以波的形式传播,而声波在空间不同位置上的相位是不同的(除非刚好相距 一个波长)。由于两耳在空间上的距离,所以声波到达两耳的相位就可能有差别。耳朵 内的鼓膜是随声波而振动的,这个振动的相位差也就成为我们判别声源方位的一个因 素。当然频率越低,相位差定位感觉越明显。 4)人的头部对高频分量的遮蔽作用产生的音色差Δf 声波如果从右侧的某个方向上传来,则要绕过头部的某些部分才能到达左耳。已 知波的绕射能力同波长与障碍物尺度之间的比例有关。人头的直径约为20cm,相当于 1700Hz声波的波长,所以频率为1000Hz以上的声波绕过头颅的能力较差,衰减越大。 也就是说,同一个声音中的各个力量绕过头部的能力各不相同,频率越高的分量衰减越 大。于是左耳听到的音色同右耳听到音色就有差异。只要声音不是从正前方(或正后 方)来,两耳听到音色就会不同,这也是人判别声源方位的一种依据。 2. 立体声广播效果的实际实现方式 立体声广播效果实际应用中,主要使用声级差(强度差)方式来实现,便于和单声 道系统兼容,没有使用时间差方式,因为它不便于和单声道系统兼容。 2.8.2 立体声的概念 立体声是指具有具有层次分明并有立体感的声音效果。自然界发出的声音都是立体 声,当把这些立体声经记录、放大等处理后再重放时,如果所有的声音都从一个扬声器 播放出来,原来的空间感(特别是声群的空间分布感)就消失了,这种重放声称为单声 重放。如果从记录到重放整个系统能够在一定程度上恢复原发生的空间感,那么,这种 具有一定程度的方位层次感以及空间分布特性的重放声就是立体声。 立体声系统是由两个或两个以上的传声器、传输通路和扬声器(或耳机)组成的系 统,经过适当安排,能使听者有声源在空间分布的感觉。立体声系统按还原声道数,可 分为双声道立体声、环绕立体声等。 1. 双声道立体声 双声立体声道就是有两个声音通道,其原理是人们听到声音时可以根据左耳和右耳 对声音相位差来判断声源的具体位置,在电路上它们往往各自传递的电信号是不一样 的,电声工程师在追求立体声的过程中,由于技术的限制,在最早的时候只能采用双声 道来实现。 2. 环绕立体声 环绕立体声通常是与双声道立体声相比,是指声音好像把听者包围起来一样的一种 重放方式。这种方式所产生的重放声场,除了保留着原信号的声源方向感外,还伴随产 生围绕感和扩展感(声音离开听者扩散或有混响的感觉)的音响效果。在聆听环绕立体 声时,聆听者能够区分出来自前后左右的声音,即环绕立体声可使空间声源由线扩展到 整个水平面乃至垂直面,因此可以逼真地再现演出厅的空间混响过程,具有更为动人的 临场感。如果与大屏幕的电视或电影的图像结合起来,使视觉和听觉同时作用,则这种 临场感就更逼真,更生动,也更具感染力。环绕立体声还有5.1、7.1、9.1声道之分,所 谓环绕立体声5.1是指左、中、右、左后、右后和超低音,图2-19所示的是杜比数字5.1环 绕声布局,7.1是在5.1的基础上又多加了2个侧环绕音箱来补充侧方位环绕声。有文献显 示有些实验环境下已经做到了22.1声道的环绕立体声。 要实现多声道环绕立体声往往需要在信源处理上进行适当的技术变换,以满足在现 行双通道上进行传输的需求,这个处理过程的算法是比较复杂的,主要掌握在少数国外 公司手中,如美国的杜比实验室、日本的索尼公司等。这部分内容将在后面介绍。 58 融媒体技术 彼此张开一定的角度,所采用的两只传声器必须严格匹配、特性一至。主轴指向左边的 传声器称为X传声器,所拾取的信号作为立体声的左声道,主轴指向右边的传声器称为Y 传声器,所拾取的信号作为立体声的右声道,如图2-20所示。重放时,X、Y传声器拾取 的信号分别送入左、右扬声器。 0° 90° 180° (a)使用托架固定的X/Y拾音装置(b)新款的X/Y拾音装置,一连动齿轮使两只 传声器同时调整主轴张开角度 图2-20 X/Y拾音方式 当声源置于两传声器的垂直平分线上时,两只传声器将拾取同样的声级,左右声道 之间的声级差为零,重放听音时,声像将恰好位于两扬声器连线的中点。如果将声源沿 着圆弧向右移动,则两传声器之间的声级差将逐渐增加,声像也将相应的逐渐向右边扬 声器移动。当两只传声器拾取到的声级差达到18dB时,如图2-21所示,声源到达S1处,则 声像S1,将感觉来自右边扬声器,因此,S1的位置便确定为最外部的拾音点,即传声器对 的有效拾音角。当声源超过S1,沿着圆弧继续向右移动时,声像仍将固定在右扬声器处。 SS1S’1S’ 015dB 有效拾音角 图2-21 X/Y拾音方式的声像定位 2. M/S拾音方式 M/S是英语Middle-Side 的缩写,是“中间”和“旁边”的意思(该方法是丹麦人首 先提出来的)。采用M/S方式的两只传声器的膜片同样需要上下尽可能的重合,M传声 器可以采用任何一种指向性,传声器的轴向指向声源,拾取前方声源总的声音信号,即 声源左右方向的和信号;S传声器则必须采用8字形指向性,传声器的轴向指向左边,与 M传声器的轴向垂直,主要拾取的是两边混响成分比例较高的声音信号,即声源左右方 向的差信号,如图2-22所示。 USM69i_Z 图2-22 常用的M/S拾音制式传声器组合 M和S传声器拾取的和、差信号需要经过一个和差变换才能形成双声道立体声的左右 声道信号。M/S拾音方式的声像定位原理如图2-23所示。 有效拾音角 S+M+M+S-SSMM+SM-SS’matrix+S-S 图2-23 M/S拾音方式的声像定位 3. A/B方式 通常用两个型号、性能完全相同的传声器,彼此间隔几十厘米(通常相距 15cm~30cm),并排平行设置于声源的前方,如图2-24所示,声源到传声器的距离要远 远大于传声器间的距离,声音经左、右两传声器拾音后将信号送至左右两个声道,这样 可使由于两传声器间的距离而造成的声级差忽略不记。 mab-1000 图2-24 使用托架固定的A/B拾音装置 A/B拾音方式的声像定位如图2-25所示,两传声器不能相距过近,否则会使立体声 效果不明显,两传声器相距又不能过远,否则中间声源的信号将很弱,出现中间空洞和 中间凹陷的现象。 有效拾音角SS1S’S’ Δt 1 图2-25 A/B拾音方式的声像定位 4. 仿真头方式 为了逼真的再现人耳听到的声音,人们发明了人工头拾音制式,也称仿真头拾音制 式。这种方式是用木料和塑料制成的假人头形状,直径17cm~21cm,在耳道的末端分 别装有两只全方向特性的传声器,两传声器的输出分别馈送到立体声的左右通道,如 图2-26所示。拾音时将仿真头放置于现场,两个传声器的输出分别作为左、右声道的信 号。图2-27所示为仿真头采录外景效果。 图2-26 人工头(仿真头)拾音装置 图2-27 仿真头采录外景效果 1. 音频的数字化 数字音频数据的存储是以0和1的形式存取的。因此首先应将模拟音频信号采样,然 后进行量化,接着转为数字信号,如图2-29所示,最后再将这些电平信号转化成二进制 数据保存。数字化后的信号有存储方便、存储成本低廉、存储、传输的过程中没有失 真、编辑和处理非常方便等特点。播放的时候再把这些数据转换为模拟信号送到喇叭播 出。数字音频的主要应用领域是音乐后期制作和录音。 模拟信号 6 抽样 24 0 量化 编码 36T7512 011 110 111 101 001 010 (3)(6)(7)(5)(1)(2) 图2-29 音频的数字化 1)采样率 根据奈奎斯特(Nyqust)采样定理,只要采样频率大于或者等于信号中所包含的最 高频率的两倍;即当信号是最高频率时,每个周期至少采样两个点,则理论上就可以完 全恢复原来的信号。 简单地说44.1kHz采样率的声音就是要花费44100个数据来描述1秒钟的声音波形。 原则上采样率越高,声音的质量越好。常用音频采样率:8kHz、11.025kHz 、16kHz、 22.05kHz、44.1kHz 及48kHz。 2)量化和编码 在幅度轴上将连续变化的幅度值用有限位的数字表示,也即将幅度离散化。量化之 后,连续变化的幅值就被有限个量化等级所取代。再将这些有限个量化等级信号幅值用 二进制数码表示的过程就是编码。 3)量化级 简单地说就是描述声音波形的数据是多少位的二进制数据,通常用bit做单位,如 16bit、24bit。16bit量化级记录声音的数据是用16位的二进制数,因此,量化级也是数 字声音质量的重要指标。我们形容数字声音的质量,通常就描述为24bit(量化级)、 48kHz采样,比如标准CD音乐的质量就是数字音频16bit、44.1kHz采样。不同的量化级量 化精度会有所不同,如图2-30所示。 00112Ts3456789t01122223330001011010101011111123A001123456789t0.5111.51.522.533.5300101001001101110010111011111023AT0.51.52.53.5s(a)量化等级为4(b)量化等级为8 量化值编码值量化值编码值 图2-30 量化级与编码 4)压缩率 通常指音乐文件压缩前和压缩后大小的比值,用来简单描述数字声音的压缩效率。 5)比特率 是另一种数字音乐压缩效率的参考性指标,表示记录音频数据每秒钟所需要的平均 比特值(比特是电脑中最小的数据单位,指一个0或者1的数),通常我们使用kbps作为 单位。CD中的数字音乐比特率为1411.2kbps,近乎于CD音质的MP3数字音乐需要的比特 率大约是112kbps~128kbps。 6)数字音频码率 数字音频码率=取样频率×量化比特数×声道数(bit) 例如CD标准,取样频率44.1kHz,量化比特数16 bit,立体声,码率为: 44.1(k)×16×2=1411.2 kb/s 2. 数字音频格式 数字音频格式有非压缩格式、无损压缩格式、有损压缩格式等。 (1)非压缩格式,如WAV、AIFF和AU。 (2)无损压缩格式,如 FLAC、Monkey’s Audio(文件扩展名为APE)、WavPack(文件扩展名为WV)、Shorten、Tom’s lossless Audio Kompressor(TAK),TTA、无损 的ATRAC Advanced、Apple和无损的Windows Media Audio(WMA)。 (3)有损压缩格式。如 MP3、Vorbis、Musepack、ATRAC、有损的Windows Media Audio(WMA)和AAC。 (4)几种主要格式说明。 ● WAV:主要用于在电脑中存储非压缩的PCM,WAV文件采用 RIFF 结构。 ● FLAC:一种无损压缩方式,适合于重要的PCM档案保存。 ● AIFF:Apple公司的音频文档标准。类似Windows 的WAV 文件。 ● MID:用于电子乐器、计算机和其他设备之间进行通信控制和同步的标准协议。 ● MP3:这是MPEG Layer-3 的格式,只有PCM 的1/10大小,是用于下载和存储最普 及的格式。 ● WMA:微软公司的Windows Media Audio 格式。 ● RA:这是互联网上音频流用的Real Audio 格式。 ● M4P:Apple 公司为iTunes Music Store 开发的,在MP4中加了数字产权管理的AAC版本。 3. 数字音频的主要技术 1)杜比环绕(Dolby Surround) 杜比环绕是原来杜比多声道电影模拟格式 的消费类版本。在制作杜比环绕声轨时,4个声 道——左、中、右和环绕声道的音频信息经矩阵编码后录制在两路声轨上。这两路声轨 可以由立体声格式的节目源如录像带及电视广播节目所携带并进入到家庭,经解码后原 有4个声道的信息得以还原并产生环绕声。杜比环绕作为最初级的环绕声标准,提供了4 个声道的环绕声支持,目前已经很少有应用。严格地说杜比环绕还不是数字音频。 2)杜比定向逻辑II(Dolby Surround Pro Logic II) 杜比定向逻辑II是一种改进的矩阵解码技术,在播放杜比环绕 格式的节目时它拥有更佳的空间感及方向感。对于立体声格式的音 乐节目,它可以营造出令人信服的三维声场,并且是将环绕声体验 带入汽车音响领域的理想技术。传统的环绕声节目与杜比定向逻辑II解码器完全兼容, 同样也可以制作杜比定向逻辑II编码的节目(包括分离的左环绕/右环绕声道)来发挥其 还音的优势(杜比定向逻辑环绕声解码器兼容杜比定向逻辑II编码的节目)。总之,杜 比定向逻辑II是一种可使用较少的声道来模拟环绕声效果的方法。严格地说杜比定向逻 辑II也不是数字音频。 3)杜比数字(Dolby Digital)/杜比AC-3 杜比数字是杜比AC-3音频编/解码技术在DVD及DTV 这类消费类格式的应用。在不断的发展普及过程中,Dolby Digital最终定型为5.1声道模式,这也是目前大多数家庭影 院或者PC多媒体桌面影院所支持的标准。杜比数字能够提供了五个全频带声道,其中包 括左、中、右屏幕声道,独立的左环绕及右环绕声道以及一个独立的用于增强低音效果 的声道,中置声道很多时候也被用于强化对白,环绕声道主要用于营造整体声场的立体 感。杜比数字首先被应用于电影音效,以5.1格式预先录制合成好的音频资料被储存在 胶片齿孔的间隙中。而后杜比数字又被应用在DVD影碟中,成为家庭影院系统的组成部 分。就目前的市场形式而言,它已经成为应用最为广泛的环绕音频标准,大部分DVD节 目都支持这个最基本的环绕音频格式。 4)杜比数字环绕EX(Dolby Digital Surround EX) 杜比数字环绕EX是在杜比数字标准上加入了第三个环绕声 道。第三个环绕声道被解码之后,通过影院或家庭影院系统中 设置在观众座位正后方的环绕声扬声器来播放(也被称为后中 置),而左/右环绕声道音频信息则通过设置在座位左右方的环绕声扬声器来播放。考虑 到系统的兼容性,这个后中置声道经矩阵编码后录制在常规的5.1系统的左/右环绕声轨 中,这样当影片在常规的5.1系统的影院系统播放时就不会发生信息丢失的现象。杜比数 字环绕EX(Dolby® Digital Surround EX)的优势在于加入了新的环绕声道,从而使 得后方声音效果得到较大的改善。目前已经有越来越多的高质量DVD影碟开始支持这个 全新的标准。 5)数字影院系统DTS( Digital Theatre System) DTS是一种用于电影和音乐的高质量多音轨环绕声技 术。DTS采用声音的相关性高效地压缩数据,采样率在 24bit下达到192kHz。 当将模拟声音信号转为数字信号时需要进行采样。CD由两条音轨组成,使用16bit PCM方式每秒采样44 100次(44.1kHz),采样可被量化为65 536(2的16次方)个级别。 使用24bit方式采样可被量化为16 777 216个级别。这种巨大的差异会使声音能够被更真实 的记录下来,并且更平滑、更具动态效果,使得声音在还原时更接近于原始的效果。 6)扩展环绕声数字影院系统DTS-ES DTS-ES标准加入了对6.1声道模式的支持,与Dobly Digital EX不同的是,DTS-ES系统中的后中置是独立的,所以DTS- ES才是真正的6.1系统,Dobly数字音频Digital EX只是一个 5.1系统的声道扩展而已。DTS-ES分为DTS-ES分离6.1及矩阵6.1两种。当DTS-ES采用 分离6.1解码时,解码器将DTS信号恢复出环绕左/右声道和环绕中置声道,产生完全分 离的6.1声场。采用矩阵6.1解码时只考虑信号的核心部分,忽略了扩展部分,但由于采 用了DTS的专利后处理ES矩阵模块,仍然能产生6.1“扩展环绕”声场。目前支持Dobly Digital EX的DVD影碟节目相对较多,而支持DTS ES的影碟则屈指可数。 7)THX(Tomlinson Holman Experiment) 美国卢卡斯影业公司制定的一种环绕声标准,它对杜比定向 逻辑环绕系统进行了改进,使环绕声效果得到进一步的增强。 THX实质是一种“产品认证”,它对重放器材例如影音源、放大 器、音箱甚至连接线材都有一套严格而具体的要求,达到这一标准并经卢卡斯认证通过 的产品,才授予THX标志。通过THX认证的系统有以下几个突出的特点: ● 功率大,功率是回放声音不失真的前提条件,尤其是低音,如果功率不够的话在 大动态下必然会失真。而通过THX认证的系统动辄就是几百瓦的输出功率,足以 保证在最大音量下也不会失真。 ● 频响平直、范围宽。通过THX认证的系统的频响范围都很宽阔,这样可以保证不 同的声音都能够得到完好的回放,不漏过任何一个微小的细节。 ● 音乐还原效果好,通过THX认证的系统的音质都很好,这样可以保证音乐有足够 感人的效果。 综合上面的说明,THX认证的好处是显而易见的。但是其缺点也很明显,就是价格高 昂。因为其要求很高,所以制造成本将会直线上升。并且THX的认证费用至少要2万美元。 2.9.2 音频编码压缩 1. 可闻声的种类 人耳可以听到的声音称为可闻声,音频信息就是指这一类声音,有语音声、音乐声 和效果声等三类。 1)语音声 语音声由口腔发出的声波,频率大致在300Hz~3400Hz之间,主要用于信息解释说 明、叙述、答问,也可以作为命令参数输入语言。 2)音乐声 音乐声是由各种乐器产生的,频谱分布整个音频范围本身可供欣赏,也可作为烘托 气氛,是音频信息的重要组成部分之一。 3)效果声 大自然产生的,如刮风、下雨、打雷等。还有一些人工产生的,如爆破声、拟音 等,对语音和音乐起补充作用。 2. 音频信息的冗余 根据统计分析,音频信号中存在着多种时域冗余和频域冗余,考虑人耳的听觉机 理,也能对音频信号实行压缩。 1)时域冗余 音频信号的时域冗余主要表现为:①幅度分布的非均匀性;②样值间的相关性;③周 期之间的相关性;④基音之间的相关性;⑤长时自相关函数;⑥静止系数。 2)频域冗余 音频信号在频域的冗余主要表现在两方面:长时功率谱密度的非均匀性;语音特有 的短时功率谱密度。 3)听觉冗余 音频信号最终是给人耳听的,可以利用人耳的听觉特性——人耳的掩蔽效应对音频 信号进行压缩。 3. 压缩编码 音频压缩编码技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号 处理技术,在不损失有用信息量或所引入损失可忽略的条件下,降低(压缩)其码率。 它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能 引入一定的噪声和失真。 4. 数字音频压缩方法 对于数字音频压缩,常用的有以下三种: ● 时域编码,包括预测编码、增量编码。 ● 频域编码,包括变换编码、子带编码。 ● 统计编码,包括熵编码、哈夫曼编码以及多种技术相互融合的混合编码等。 不同的压缩编码方法,其算法的复杂程度(包括时间复杂度和空间复杂度)、重建 音频信号的质量、算法效率(即压缩比)以及编解码延时等都有很大的不同,数字音频 广播要挑选最合适的方法。 5. 音频广播常用的编码标准 音频广播常用的编码标准有三种,下面分别进行介绍。 1)MUSICAM MUSICAM编码的全称叫做“掩蔽型自适应通用子频带集成编码与复用”。它 是MPEG-1标准中的ISO/IEC11172-3,是1993年公布的音频压缩编码国际标准。我国 现有的卫星和有线标清数字电视系统的音频压缩编码标准采用的是MPEG-1第Ⅱ层即 MUSICAM。 MPEG-1音频压缩编码器输入双声道(L、R)PCM数字音频信号, 用滤波器阵分割成等宽的32个相同大小的子带,每个子带的量化和比特分配用心理 声学模型确定,该模型符合人类听觉的掩蔽特性。 量化后的取样值与比特因子和其他编码信息合成为所谓的“帧结构”,由此生成压 缩数据流。 MPEG-1算法由层Ⅰ、层Ⅱ、层Ⅲ三种算法构成,其共同点是算法都建立在32个子带 编码的基础之上,层Ⅰ与层Ⅱ的最大不同是帧长度,层Ⅰ汇集384个取样加以处理,而层 Ⅱ汇集3倍于此的1152个取样加以处理。层Ⅱ使用较低的比特率,采用较长的帧长度,通 道数为2,取样频率是32kHz、44.1kHz、48kHz中的任意一个。MPEG-1算法的层Ⅰ、层 Ⅱ、层Ⅲ主要参数性能如表2-1所示。 表2-1 MPEG-1算法的层Ⅰ、层Ⅱ、层Ⅲ的主要参数与性能 层 号 Ⅰ Ⅱ Ⅲ 每声道数码率 192kHz 128kHz 64kHz 压缩比 1∶3.6 1∶5.6 1∶11 滤波器 子频带编码 子频带编码 子频带编码+变换编码 频谱分辨率 32个子带 32个子带 32个子带、18条子带 特 征 基本算法 最佳编码 滤波器组和熵编码的联合应用 应 用 VCD DAB、DVB-C/S 通过ISDN传送声音,计算机多媒体 棱镜 阳光 紫 蓝 青 绿 黄 橙 红 图3-2 白光可以被分解为多个单色光 3. 光源与色温 广义地讲,一切能在可见光波长范围内辐射电磁波的东西都可以称为光源;狭义地 讲,就是指照明,能在可见光整个波段范围内能提供较均匀分布的光能辐射体才是光 源。有天然光源和人造光源,天然光源主要是日光和火焰,人造光源主要是各种各样的 灯,如白炽灯、日光灯、LED灯等。 色温即光源色品质量的表征,是指当光源发射光的相对辐射功率谱及相应颜色与绝 对黑体在某一温度下辐射光色完全相同时,绝对黑体的温度称为该光源的色温,单位以 绝对开氏温度(K)表示。这里的绝对黑体是既不反射也不透射光线,而能完全吸收入 射光的物体。绝对黑体在自然界是不存在的。其实,色温并非光源本身的实际温度,而是 表征光源波谱特性的参量。在几种标准白光中,色温较低者,偏红;色温较高时,偏蓝。 4. 五种标准光源 按国际规定选用如下五种主要标准光源(即标准白光),它们的光谱分布如图3-3 所示。 CBφ 1.4 1.2 A 1.0 E 0.8 0.6 0.4 D6500 0.2 0 400 500 600 700 800 900 λ/nm 图3-3 五种标准光源(即标准白光)的光谱分布 1)A光源 它相当于钨丝灯在2800 K时发出的光。其波谱能量分布如图中曲线A所示,它的灯光 常带橙红色,不如太阳光白,A光源的相关色温为2854K。 2)B光源 它接近于中午直射的阳光,相关色温为4800K,可以用特制的滤色镜从A光源获得。 3)C光源 它相当于白天的自然光,相关色温为6800K,也可以用特制的滤色镜从A光源获得。 由图中的曲线C可以看出,其波谱能量在400nm~500 nm处较大,所含蓝光成分多。 4)D65光源 它相当于白天的平均照明光,相关色温为6500K,被作为彩色电视中的标准白光, 可以由彩色显像管荧光屏上的三种荧光粉发出的光适当配合而获得。相应的光谱分布如 图中的虚线D6500所示,它与C光源很接近。 5)E光源 它是一种假想的等能白光(E白),光谱分布为一条直线,即所有波长的光都具有相 等辐射功率时所形成的白光,这实际上是不可能的。采用它纯粹是为了进行理论研究和 简化色度学的计算。 3.1.2 视觉特性 人的视觉特性是人能感觉到图像的颜色和亮度是眼睛的生理结构所决定的,是电视 技术发展的重要依据。电影和电视都是根据人眼的视觉特性发明的。 1. 视觉灵敏度 波长不同的可见光光波,给人的颜色感觉、亮度感觉也不同,人眼对不同波长光的 灵敏度是不同的,研究表明人眼对波长为555nm的黄绿光最敏感,如图3-4所示。 400500600700 波长/nm 相对视敏度 V(λ) 0.80.60.40.201.0VG(λ) 20VB(λ)VR(λ) 图3-4 相对视敏函数曲线 人眼的灵敏度因人而异,同一个人眼睛的灵敏度也随年龄和健康状况有所变化,所 以采用统计方法,用许多正常视力的观察者来做实验,取其平均值。 2. 亮度感觉 在不同的亮度环境下,人眼对于同一实际亮度所产生的相对亮度感觉是不相同的, 如图3-5所示。当人眼分别适应了A、B、C点的环境亮度时,人眼感觉到“白”和“黑” 的范围如虚线所示,它们所对应的实际亮度范围比人眼的视觉范围小很多。并且A点的 实际亮度对于适应了B点亮度的眼睛来说感觉很暗;而对于适应了C点亮度的眼睛来说, 却感觉很亮。 600 400 亮度感觉 200 B 白 黑 A 白 黑 C 白 杆状细胞 黑 黑 黑 白 白 锥状细胞 10- 4 10- 2 1 102 104 106 亮度/cd·m- 2 图3-5 眼睛的亮度感觉 (1)要使人眼感觉到两个画面有亮度差别,必须使两者的亮度差≥ΔLmin ΔLmin是有限小量,而不是无限小量。因此,人眼察觉亮度变化的能力是有限的。 (2)对于不同的环境亮度L 人眼可觉察的最小亮度差ΔLmin可以不同;ΔLmin/L是相同的,并等于一个常数,这 个系数叫相对对比度灵敏度阈(费赫涅尔系数): ξ= ΔLmin (3-1) L 3. 视觉惰性 实验证明,当一定强度的光突然作用于视网膜时,不能在瞬间形成稳定的主观亮度 感觉,而是按近似指数规律上升;当亮度突然消失后,人眼的亮度感觉并不立即消失, 而是按近似指数规律下降,如图3-6所示。 光脉冲亮度 t (a) 视觉亮度 t1 t2 t (a)作用于人眼的光脉冲亮度(b)主观亮度感觉 图3-6 人眼的视觉惰性 人眼的亮度感觉总是滞后于实际亮度的,这一特性称为视觉惰性或视觉暂留。 视觉惰性是现代电视和电影的基础。电影和电视都是将一幅幅静止的画面以一定的 频率在屏幕上轮流显示。虽然人眼看到的是静止的画面,但是由于视觉暂留特性,前一幅 画面的印象尚未消失,后一幅画面的印象又开始建立,因此人眼感觉不到画面是断续的。 视觉产生连续感的前提是静止画面的时间间隔小于视觉暂留时间,即画面的换幅频 率大于视觉暂留时间的倒数。 如果取视觉暂留时间为0.05秒,则画面的换幅频率必须要大于20Hz才能产生连续感。 电影在拍摄和放映时是按每秒24格进行的,因此其换幅频率为24Hz,满足人眼产生 连续感的需求。电视的帧频为25Hz或30Hz,同样也满足连续感的需要。 4. 人眼的分辨力 分辨力是指人眼在观看景物时对细节的分辨能力。对人眼进行分辨力测试的方法, 如图3-7所示,在眼睛的正前方放一块白色的屏幕,屏幕上面有两个相距很近的小黑点。 逐渐增加画面与眼睛之间的距离,当距离增加到一定长度时,人眼就分辨不出有两个黑 点存在,感觉只有一个黑点。这说明眼睛分辨景色细节的能力有一个极限值。 Lθd 图3-7 人眼的分辨角 我们将这种人眼分辨景物细节的能力称为分辨力,又称为视觉锐度。它等于人眼视 敏角的倒数,即分辨力=1/θ。影响分辨力的因素: (1)与物体在视网膜上成象的位置有关。黄斑区锥状细胞密度最大,分辨力最高。 越是偏离黄斑区,光敏细胞的分布越稀,分辨力也就低。 (2)与照明强度有关。照度太低,仅杆状细胞起作用,分辨力大大下降,且无彩色 感;照度太大,分辨力不会增加,甚至由于“眩目”现象而降低。 (3)与对比度Cr有关。 00×100% . = BBBCr,其中B为物体亮度,B0为背景亮度,当 两者接近,分辨力要降低。 (4)与被观察物体的运动速度有关。运动速度快,分辨力将要下降。 分辨力是指人眼在观看景物时对细节的分辨能力。人眼对彩色细节的分辨力比对黑 白细节的分辨力要低。如表3-1所示。 表3-1 人眼分辨能力与细节颜色的关系 细节色别 黑白 黑绿 红绿 绿蓝 相对分辨力 100% 94% 40% 19% 因为人眼对彩色细节的分辨力较差,所以在彩色电视系统中传送彩色图像时,只传 送黑白图像细节,而不传送彩色细节,这样做可减少色信号的带宽,这就是大面积着色 原理的依据。人眼对运动景物的分辨力要低于对静止景物的分辨力。 3.1.3 色度学基础 1. 物体的颜色 物体的颜色就是物体的发(反、透)射光作用于人眼所引起的主观感觉。黑白是亮 度不是颜色。自然界中的物体可以分为发光体(光源)和不发光体两大类。不发光体分 为透明和不透明两类:透明体的颜色是由该物体透射的光谱成分决定的;不透明物体的 颜色取决于物体对各种波长光的反射特性。 不发光体的颜色与照射光的光谱和不发光体对照射光的反射、透射特性有关。如红 旗反射太阳光中的红色光、吸收其他颜色的光而呈红色;绿叶反射绿色的光、吸收其他 颜色的光而呈绿色;白纸反射全部太阳光而呈白色;黑板能吸收全部太阳光而呈黑色。 物体的颜色还与照明光源的光谱分布有关。绿叶拿到暗室的红光下观察成了黑色, 这是因为红光源中没有绿光成分,树叶吸收了全部红光而呈黑色。 描述一种色彩需要用亮度、色调和饱和度三个基本参量,这三个参量称为彩色三要素。 亮度是指彩色光作用于人眼引起明暗程度的感觉,通常用Y来表示。彩色光辐射的 功率越大,亮度越高,反之亮度越低。不发光物体的亮度取决于它反射光功率的大小。 若照射物体的光强度不变,物体的反射性能越好,物体越明亮,反之越暗。对于一定的 物体,照射光越强,物体越明亮,反之越暗。 色调反映彩色的类别,通常所说的红色、绿色、黄色等,就是指不同的色调。不同 波长的光所呈现的颜色不同就是指其色调不同。如果改变彩色光的光谱成分,就必然引 起色调的变化。例如,在红光中混入绿光就会使人们感觉到色调变成黄色。发光物体的 色调由光的波长决定,不同波长的光呈现不同的色调,不发光物体的色调由照明光源和 该物体的吸收、反射或透射特性共同决定。 饱和度是指颜色的深浅程度,即颜色的浓度。对于同一色的彩色光,其饱和度越 高,它的颜色就越深;饱和度越低,它的颜色就越浅。在某一色调的彩色光中掺入白 光,会使其饱和度下降,掺入的白光越多,其饱和度就越低。同一色调的彩色光,会给 人以深浅不同的感觉,深红、粉红是两种不同饱和度的红色,深红色饱和度高,粉红色 饱和度低。 谱色光就是纯色光,其饱和度为100% 。饱和度低于100% 的彩色称为非饱和色,日常 生活中所见到的大多数彩色是非饱和色。白光的饱和度为0。 色调和饱和度合称为色度。色度即说明彩色光颜色的类别,又说明了颜色的深浅程 度。在彩色电视系统中,所谓传输彩色图像,实质上是传输图像像素的亮度和色度。 2. 人眼的彩色视觉特性 实验表明,人眼相同的彩色感觉可以来源于不同的光谱组合,颜色感觉相同,光谱 组成不同的光称为同色异谱色。 3. 三基色原理与混色法 1)视觉三色假说 人的锥状细胞又分为三类,分别称为红敏、绿敏和蓝敏。如果某束光线只能引起某 一种光敏细胞兴奋、而另外两种光敏细胞仅受到很微弱刺激,我们感觉到的便是某一种 色光;若红敏细胞受刺激,则感觉到的是红色;若红、绿敏细胞同时受刺激,则产生的 彩色感觉与由黄单色光引起的视觉效果相同。这三种光敏细胞各有各的光谱光效率曲 线,如图3-8所示,其对颜色的感觉,就形成主观上的彩色感觉。 400500600700λ(n) 0.20.40.60.81.0 紫蓝青绿黄橙红 红锥状细胞 绿锥状细胞 蓝锥状细胞 总响应 相对响应 图3-8 锥状细胞敏感曲线 根据人眼的视觉特性,在电视机中重现图像时并不要求完全重现原景物反射或透射 光的光谱成分,而是应获得与原景物相同的彩色感觉。 2)混色的含义 仿效人眼三种锥状细胞,可以选出三种单色,任一种单色都不能由其他两种单色混 合得到,将它们按不同比例进行组合,可得到自然界中绝大多数的彩色。具有这种特性 的三个单色光叫基色光,并总结出三基色原理: ● 三基色必须是相互独立地产生; ● 自然界中的大多数颜色,都可以用三基色按一定比例混合得到; ● 三个基色的混合比例,决定了混合色的色调和饱和度; ● 混合色的亮度等于构成该混合色的各个基色的亮度之和。 因为人眼的三种锥状细胞对红光、绿光和蓝光最敏感,所以在红色、绿色和蓝色光 谱区中选择三个基色按适当比例混色可得到较多的彩色。在彩色电视中,选用了红、 绿、蓝作为三基色,分别用R、G、B来表示。国际照明委员会(CIE)选定了红基色的 波长为700nm,绿基色的波长为546.1nm,蓝基色的波长为435.8nm。 三基色原理是彩色电视技术的基础,摄像机把图像分解成三基色信号,电视机又用 三基色信号还原出原图像的色彩。 三基色光相混合得到的彩色光的亮度等于三种基色亮度之和,这种混合色称为相加 混色。将三束等强度的红、绿、蓝圆形单色光同时投射到白色屏幕上,会出现三基色的 圆图,其混合规律如图3-9所示。 红 黄紫 蓝青 白 绿 图3-9 相加混色 彩色电视要传送的是亮度不同、色调和色饱和度千差万别的彩色信息,有了三基色 原理,我们只需要将要传送的颜色分解为三基色(红、绿、蓝),然后再分别以对应的 一种电信号进行传送就可以了。为了与黑白电视系统兼容,实际传送的是亮度和色差 (表示色度)信号。 3)混色法 三基色按照不同的比例混合获得彩色的方法称为混色法,有相加混色法和相减混色 法。相加混色主要用于彩色电影电视,相减混色主要用于染料合成和绘画。其中相加混 色又可以分为: ● 空间混色法。利用人眼空间细节分辨力差的特点,将三种基色光在同一平面的对 应位置充分靠近,只要三个基色光点足够小且充分近,人眼在离开一定距离处将 会感到是三种基色光混合后所具有的颜色。这种空间混色的方法是同时制彩色电 视的基础。 ● 时间混色法。利用人眼的视觉惰性,顺序地让三种基色光出现在同一表面的同一 处,当相隔的时间间隔足够小时,人眼会感到这三种基色光是同时出现的,具有 与三种基色相加后所得颜色相同的效果。这种相加混色方法是顺序制彩色电视的 基础。 ● 生理混色法。人的两眼同时分别观看不同颜色的同一彩色景像时,使之同时获得 两种彩色印像,两种彩色印像在大脑中产生相加混色的效果。 3.1.4 颜色的度量与亮度方程 1. 配色实验 给定一种彩色光,可通过配色实验来确定其所含三基色的比例,配色实验装置如图 3-10所示。实验装置是由两块互成直角的理想白板将观察者的视场一分为二,在一块白 板上投射待配色,另一块白板上投射三基色。 光量调节 视场 待配彩色 三基色光源 RGB 图3-10 配色实验 调节三基色光的强度,直至两块白板上彩色光引起的视觉效果完全相同。记下三基 色调节器上的光通量读数,便可写出配色方程: F=R(R)+G(G)+B(B) (3-2) 式中,F为待配色的彩色光的彩色量,(R)、(G)、(B)为三基色单位量。 经过试验发现要配成标准白光E白所需红、绿、蓝三基色的光通量比为1∶4.5907∶ 0.0601,为了简化计算,规定红基色光单位量的光通量为1lm,绿基色光和蓝基色光单位 量的光通量分别为4.5907 lm和0.0601 lm。 2. XYZ制色度图 配色实验的物理意义明确,但进行定量计算却比较复杂,实际使用很不方便,为此 进行了坐标变换: (X)=0.4185(R)-0.0912(G)+0.0009(B) (3-3) (Y)=-0.1587(R)+0.2524(G)+0.0025(B) (3-4) (Z)=-0.0828(R)+0.0157(G)+0.1786(B) (3-5) 但是(X)、(Y)、(Z)不代表实际彩色,故称其为计算三基色。 在XYZ计色制中,任何一种彩色的配色方程式可表示为 F=X(X)+Y(Y)+Z(Z) (3-6) 式中X、Y、Z为标准三色系数,(X)、(Y)、(Z)为标准三基色单位。在XYZ计 色制中标准三色系数均为正数,系数Y的数值等于合成彩色光的全部亮度,系数X、Z不包 含亮度,合成彩色光色度仍由X、Y、Z的比值决定。当X=Y=Z时,配出等能白光E白。 色度是由三色系数X、Y、Z的相对值确定的,与X、Y、Z的绝对值无关,如果仅考虑 色度值时,可以用三色系数的相对值表示。 mXYZXXxXYZmYYyXYZmZZzXYZm=++ == ++ == ++ == ++ (3-7) 公式3-7中,m为色模,表示某彩色光所含标准三基色单位的总量,它与光通量有 关,对颜色不产生影响;x、y、z为相对色度系数,又叫色度坐标。由公式(3-6)可知 x + y + z=1 (3-8) 式(3-7)表明,当某一彩色量F的相对色度系数x、y已知时,则z也为已知,即z是一 个非独立的参量。这样就可将由配色实验得到的数据,换算成x、y坐标值,并画出其平 面图形,即x -y标准色度图,如图3-11 所示。 y 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 (Z) 400 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 (R) R1T(Y) 绿(G) 等色调线 等饱和度线 谱色曲线(单位nm) 根据指定的三基色(R1、G1、B1) 可得到的彩色区域 绿 (X)x 粉红 橙ABECD0.1510520530540550560570580590600610630700~740460470490480500bB11g 青绿 蓝绿 绿蓝 蓝 紫 蓝紫 微红 红紫紫红 紫 微紫的粉红 黄绿黄 白 (B) 图3-11 XYZ色度图 该色度图具有如下特点: ● 舌形曲线全部位于第一象限,所有的单色光都位于舌形曲线上,舌形曲线称为谱 色轨迹。它们的饱和度均为100%,曲线旁注有单色光波长值。 ● 舌形曲线上任一点与E白点的连线称为等色调线。 ● 不在同一等色调线上的任意两点,表示了两种不同的颜色,由这两种颜色组成的 全部混合色都处在这两点的连线上。 ● 饱和度相同的彩色所对应的各点的连线称为等饱和度线,见图中所注。 ● 在谱色曲线内任取三点对应的彩色作基色(例如,图中R1、G1、B1),则由此三 基色混合而成的所有彩色都包含在以这三点为顶点的三角形内。 80 融媒体技术 二个像素值指的是垂直方向的像素数量。一个图像所含的像素数量越大,图像所含的信 息就越多,被清楚还原的尺寸也就越大。在输出大小相同的情况下,像素值越大,单个 细节就显示得越清楚,就越会形成清晰的视觉效果,如图3-12所示。 图3-12 分辨率为72dpi(左)和300dpi(右)的图像示例 2. 显示分辨率(Display Resolution) 确定屏幕上显示图像区域的大小,即构成全屏显示的像素点的个数,以每行拥有的 像素点数乘以屏幕显示行数来表示。例如目前高清电视的显示分辨率为1920×1080,4k 电视的显示分辨率为3840×2160。 显示分辨率有最大显示分辨率和当前显示分辨率之分:最大显示分辨率由物理参 数,即显示器和显示卡(显示缓存)来决定,当前显示分辨率由当前设置的参数决定。 若图像像素的点数大于显示分辨率像素的点数,则该图像在显示器上只能显示一部 分。只有当二者相同时,一幅图像才能充满整屏。图3-13显示了不同显示分辨率与图像 分辨率之间的关系。 1920×1080 2560×1080 3440×1440 2560×1440 3840×2160 4k 图3-13 不同显示分辨率与图像分辨率之间的关系 3. 像素深度 描述图像每个像素数据所占的二进制位数。它决定了彩色图像中可出现的最多颜色 数,或灰度图像中最大的灰度等级数。颜色位数越多,描述的图像越艳丽,产生的数据 量也越大。图3-14所示为不同颜色位数的同一图像。 C:\Documents and Settings\Administrator\桌面\72.bmpC:\Documents and Settings\Administrator\桌面\7.bmpC:\Documents and Settings\Administrator\桌面\7.jpg 2色 16色 真彩 图3-14 不同颜色位数的图像 像素深度与色彩的关系如表3-3所示。 表3-3 像素深度与色彩的关系 彩色深度 彩色信息数量 彩色模式 1位 21=2种颜色 位图模式(Bitmap) 8位 28=256种颜色 索引模式(Indexed)、灰度模式(Grayscale) 24位 224=16 777 216种颜色 RGB色彩模式、CMYK色彩模式 4. 图像容量 指图像文件的数据量,其计量单位是字节(byte)。对图像容量有影响的因素包括 色彩的数量、图像的分辨率、图像的格式等。 图像容量的计算公式: 图像数据量大小 =垂直像素总数×水平像素总数×色彩深度/8 (3-11) 3.2.2 矢量图和位图 1. 矢量图 矢量图是计算机通过数学运算而产生的图形,如画点、画线、画曲线、画圆、画矩 形等,因此,该图所占容量很小,缩放、旋转、移动时图像不会失真,而且它的显示效 果不受幅面大小或显示器分辨率的影响。矢量图的缺点是图像显示时花费时间比较长以 及真实世界的彩色图像难以转化为矢量图等。 矢量图的文件格式视生成它的软件的不同而不同,如Adobe Illustrator的.AI、.EPS和 SVG、AutoCAD的.dwg和dxf、CorelDRAW的.cdr、Windows标准图元文件.wmf和增强型 图元文件.emf等等。 2. 位图 位图是将一副图像在空间上离散化,即将图像分成许许多多的像素,每个像素用 若干个二进制位来指定该像素的颜色或灰度值,如图3-15所示。根据是否采用压缩的方 法,位图文件又分为许多种格式,如:.bmp、.tif、.gif和.jpg等。 位图有显示速度快以及真实世界的图像可以通过扫描仪、数码相机、摄像机等设备 未定标题1 图3-16 图像与像素 每幅画面上的亮度与色度都是景物之光学特性Ψ是空间坐标x,y,z和时间t的四维函数。 Ψ=f (x,y,z,λ,t) (3-12) 公式(3-12)中:t表示时间;x,y,z表示空间坐标;λ是光波长(颜色);Ψ表示某 点光学特性,既包括亮度有包括色度。 对于平面黑白电视亮度信息B,可以简化为: B=f (x,y,t) (3-13) 平面彩色电视亮度和色度信息既是空间(二维)函数,同时又是时间函数。 根据人眼对细节分辨力有限的视觉特性,可以将平面图像看成由许多像素组成,像 素越小,单位面积上的像素数目越多,图像越清晰。 我们可以通过扫描方法获得图像像素,它是按时间顺序逐一传送空间分布的每一个 像素的亮度和色度,实现把空间坐标(x,y)也转换成时间t的函数。 2)图像的传送 ● 同时制传送(并行传输):将构成一幅图像的所有像素同时转换成电信号,并同 时传送出去。该模式的关键点是每一像素需占用一个传输通道,由于在技术和经 济上都不现实,该模式并没有真正实现,只是一种启蒙设想。 ● 图像的顺序制传送:按一定顺序将每像素的光学信息轮流转换成电信号,用一条 传输通道依次传送出去,接收端依次接收并重现,如图3-17所示。该模式的关键 S1S2 传输通道 光电转换电光转换 图3-17 图像的顺序制传送原理 是传送速度要快,传送时刻要准确,收发双方应同步工作。收发同步是电视系统 中一个非常重要的问题。 2. 扫描原理 电视图像的采集和重现中的关键是通过扫描来实现的。所谓扫描是电视系统中顺序 分解像素和重现像素的实现过程,它是将组成一帧图像的像素按顺序转换成电信号的过 程(或逆过程)。扫描是顺序制传送系统的核心,包含两个过程:发送端光电转换过程 中的扫描和接收端电光转换过程中的扫描。扫描的实质就是空时——时空转换。 电视系统的扫描轨迹为直线型的线性扫描,分为水平扫描(行扫描)和垂直扫描 (场扫描)两种。 1)行扫描 1 行扫描是指其正程自左至右,逆程自右至左。 2 行扫描在应用中又分为逐行扫描和隔行扫描。 3 ● 逐行扫描(Interleaved scanning)是电子束 4 在光电靶或荧光屏上自左向右,从上到下均 5 匀地一行接一行地扫描,如图3-18所示。 67 ● 隔行扫描(Progressive scanning)将一帧画图3-18 逐行扫描 面的图像分为两场扫描。第一场只扫描奇数行,第二场只扫描偶数行,如图3-19 所示。 1 1 2 3 3 2 4 5 5 4 6 7 7 6 8 9 9 8 10 11 11 10 12 13 13 12 (a)奇数 场 (b)偶数场(c)奇数场和偶数场合成结果 (e)奇数场扫描图 像 (f)偶数场扫描图像 图3-19 隔行扫描