本册书概况和使用建议
本册书为《图像工程》的下册,主要介绍图像工程的第三层次——图像理解的基本概念、基本原理、典型方法、实用技术以及国际上有关研究的新成果。
本册书主要内容可划分在四个单元中。第一个单元(包含第1,2,3,4章)主要介绍图像工程的整体发展状况和图像理解与其他相关学科的联系,基本的视觉感知原理和过程,高维图像采集以及3D目标表达方法等。这些也为进一步学习后面单元的内容打下了基础。第二个单元(包含第5,6,7,8章)论述景物恢复(重建)的各种典型技术,对应图像理解的较低层次。这里主要涉及立体视觉技术(包括双目和多目),以及由单目图像恢复深度信息的技术(包括立体光度学、从运动求取结构、从阴影恢复形状、从纹理变化确定表面朝向等)。第三个单元(包含第9,10,11,12章)论述场景解释的概念和原理,对应图像理解的较高层次。这里论述知识和表达基础及常用方法、广义匹配的多种技术,以及图像模式识别的基础工具、图像理解理论的内容发展和图像信息系统的概况比较。第四个单元(包含附录A,B,C)分别介绍了三个典型图像理解技术的应用领域: 多传感器图像信息融合、人脸和表情识别、基于内容的图像和视频检索。
本册书共有12章正文、3个附录以及习题解答和参考文献。在这17个一级标题下共有71个二级标题(节),再往下还有130个三级标题(小节)。全册书共有文字(也包括图片、绘图、表格、公式等)约60万字。本册书共有编了号的图298个、表格34个、公式654个。为便于教学和理解,本册书共给出各类例题73个。为便于检查教学和学习效果,各章后均有思考题和练习题,本册书共有思考题和练习题204个,对其中的94个练习题(题前标“*”号)提供了参考答案。另外,书末列出了直接引用和提供参考的300多篇文献的目录。
关于本册书的使用可借助下图解释。
本册书主要包括12章,根据内容可结合成为三个单元,每个单元包括的章如三个双虚线框所示。每个单元选了三章作为基本内容,即第1章、第3章、第4章,第5章、第7章、第8章,第9章、第10章、第12章(可按此次序学习)。在包括了这9章基本内容的基础上,可考虑根据专业和学时选择其他内容。如果需要了解人类视觉感知方面的内容,可在第1章后学习第2章。第6章是第5章的扩展,如果有较好的数学基础且比较关注立体视觉的技术,可在第5章后学习。第11章涉及模式识别的内容,如没有学习过相关的课程可在第10章后学习。最后本册书还包括三个附录(在图中单虚线框内),均为涉及有关图像理解(图像工程高层)技术的应用内容,可根据专业和科研方向在第12章后选择学习。
本册书各章内容基本平衡,根据学生的基础和背景,每章可用2~4课堂学时。各章后面均有较多的思考题和练习题(包括若干涉及编程实现算法、编写例题或习题、进行开放式讨论等),每章平均可安排1~3课外学时来完成,有些可作为专题讨论、大作业或项目训练。
本册书主要介绍图像理解的内容,相比图像处理和图像分析更专业化一些,需在学习完本套书上册(或至少学习了其中的第一个单元和第二个单元)后再学习(特别是对于自学的读者)。如果已经学习了本套书中册(或至少其中的第二个单元和第三个单元的基本内容),则对学习本册书更为有利。
全套书第2版前言
Preface本套书为《图像工程》第2版,共分3册,分别为《图像工程(上册)——图像处理》、《图像工程(中册)——图像分析》和《图像工程(下册)——图像理解》。整套书全面介绍图像工程的基本概念、基本原理、典型方法、实用技术以及国际上有关研究的新成果。
本套书的第1版也分3册,其中《图像工程(上册)——图像处理和分析》1999年出版,《图像工程(下册)——图像理解和计算机视觉》2000年出版,《图像工程(附册)——教学参考与习题解答》2002年出版。至今各册已一共重印近30次,总计达10多万册。根据在网上查询的结果,已有约上百所学校院所采用该套书作为教材、教学参考书或考研指定书/参考书。从读者向作者发来的上千封电子邮件中,也得知许多人在利用该套书进行自学。
本套书第1版自出版后也得到相关领域研究人员的广泛使用。根据利用“中国期刊网”中的“中国期刊全文数据库”和“万方数据库”中的“万方数字化期刊”所做的检索,可知本套书第1版自出版至今,已被600多篇在国内重要学术期刊上发表的研究文献所引用。又根据利用“中国期刊网”中的“中国优秀博硕士论文全文数据库”所做的检索,可知本套书第1版自出版以来,已被1000多篇博士和硕士论文所引用。
该套书的多次重印和多次被引用,表明作者一直倡导的,为了对各种图像技术进行综合研究、集成应用而建立的整体框架——图像工程,作为一门系统地研究各种图像理论、技术和应用的新的交叉学科得到了广泛的认可。同时,随着研究的深入和技术的发展,编写新版的工作也逐渐提到议事日程上来。
第2版的编写开始于2003年,是年作者在学术休假期间,作为新加坡南洋理工大学的访问教授,一方面在那里开出一门新课“图像分析”(Advance in Image Analysis),并参与了其他几门课的教学工作; 另一方面,静心构思了整套书的新框架,并开始了第2版的编写。为使新版有更多新的内容,在那里收集了10多本相关书籍,还借阅了20多本书,并作了15万字的笔记。这些书籍中,既包括多本典型的图像处理、图像分析和图像理解教材,也包括如成像技术、数字电视、小波变换、二值图像处理、非线性图像处理、三维图像处理、图像分割和组合、纹理分析、形状分析、立体图像分析、体视学、多视几何、图像代数、视觉表达和识别等专著。这为新版的编写打下了坚实的基础。第2版在内容的深度和广度选择上,仍希望读者能通过本书的学习,独立地和全面地了解该领域的基本理论、技术、应用和发展。
第2版的编写仍如第1版那样,在编写的方针上,力求具有理论性、实用性、系统性、实时性; 在内容叙述上,力求理论概念严谨,论证简明扼要。考虑到图像技术的飞速发展,第2版既保留了第1版有代表性的经典内容,也削减了一部分近年使用不多的陈旧内容,同时还充实了近年许多最新的研究成果和得到广泛使用的典型技术。这些新内容既参考了许多有关文献,也结合了作者的一些研究工作和成果以及这些年来的教学教案。第2版在整个篇幅上比第1版有相当的增加。
与第1版相比,第2版有如下几个特点:
第一,从总体框架上,第2版按图像工程的三个层次分为对应的三册。2004年,作者在清华大学也开出了“图像分析”课程,这样加上原有的两门课程(“图像处理”和“图像理解”),三门课程和三册教材就互相对应起来了。为此,第2版每册书都增加了教学使用建议,以帮助使用者。
第二,从教学的角度出发,以章为单位,对内容进行了均衡; 同时对内容较多的技术,划分成基础部分和深入部分,以有利于不同专业背景使用者的选择。
第三,从学习的角度出发,结合教学实践和读者对第1版书的反馈意见,对一些重要和基本的章节概念,增加了解释和示例,以帮助读者理解和自学。
第四,从深入学习和开展科研的角度出发,在每章结尾处增加了各节小结以及为读者扩大视野和进一步研究而提供的一些相关参考文献的介绍,以帮助读者有的放矢地查阅。
第五,从使用方便的角度出发,将习题和对应的解答都集中在同一册书中。
本套书的第1版从1996年开始编写,至今已近10年。这期间,作者与许多读者(包括教师、学生、自学者)有过各种形式的讨论和交流,有的是通过面谈,有的是通过电话或电子邮件。这些讨论和交流使作者获得了许多宝贵的意见和建议,为完善第1版和编写第2版起到了不可或缺的作用。值得指出的是,书中汇集了几年来不少听课学生的贡献,许多例题和练习题是在历届学生作业和课堂讨论的基础上提炼出来的,一些图片还直接由学生帮助制作,在选材上也从学生的反馈中受到许多启发。借此机会一并表示衷心的感谢。
本套书中有相当内容基于作者和他人共同研究的成果,特别是历年的学生边辉、陈挺、陈伟、戴声扬、傅卓、高永英、葛菁华、胡浩基、黄英、黄翔宇、贾波、贾慧星、姜帆、李娟、李乐、李勍、李睿、刘青棣、刘惟锦、刘晓旻、刘忠伟、陆海斌、罗惠韬、罗沄、钱宇飞、秦暄、谭华春、王志明、吴高洪、吴玮、徐丹、徐枫、徐寅、薛景浩、严严、杨劲波、杨翔英、姚玉荣、俞天利、张宁和朱小青,博士后高立志以及进修教师崔京守、石俊生、杨卫平、张贵仓等,第1版和第2版采用的图片除作者自己制作的外,也包括他们在研究工作中收集和实验得到的。本套书应该是多人合作成果的体现。
全书在编写过程中得到陈国新编辑认真的审阅和精心的修改,这既使全书增色不少,也使作者受益匪浅。
最后,作者感谢妻子何芸,女儿章荷铭以及父母家人在各方面的理解和支持!
章毓晋
2006年夏于清华园
通信: 北京清华大学电子工程系,100084
电话: (010) 62781430
传真: (010) 62770317
电子邮件: zhangyj@ee.tsinghua.edu.cn
个人主页: oa.ee.tsinghua.edu.cn/~zhangyujin/
研究室网: image.ee.tsinghua.edu.cn