首页 > 图书中心 >图书详情

计算机视觉基础

本书全彩印刷,是学习计算机视觉的第一本书。 配套PPT,资源咨询请加QQ:2301891038(仅限教师)

作者:[加] 詹姆斯·彼得斯(James F. Peters)著,章毓晋 译
定价:98
印次:1-4
ISBN:9787302529958
出版日期:2019.08.01
印刷日期:2022.09.01

本书介绍计算机视觉的基础内容,比较侧重计算几何和目标检测方面。本书对图像网格的构建和叠加、德劳内三角剖分和沃罗诺伊镶嵌、多边形拼贴、图像拓扑等都有比较全面深入的介绍,并对图像结构给出了直观可视的描述。书中提供了大量相应的Matlab程序,可结合原理学习进行实验,以进一步加深理解并解决实际问题。

more >

前 言 本书介绍计算机视觉基础。计算机视觉(也称为机器视觉)的主要目标是基于由各种 相机捕获的图像内容来重建和解释自然场景(参见R. Szeliski[187])。计算机视觉系统包括 诸如卫星测绘、机器人导航系统、智能扫描仪和遥感系统之类的东西。在计算机视觉研究 中,重点是从图像中提取有用的信息(参见S. Prince [159])。计算机视觉系统通常模仿人 类视觉感知。计算机视觉系统中选择的硬件是某种形式的数码相机,被编程为近似视觉感 知。因此,计算机视觉、数字图像处理、光学、光度学和光子学之间存在密切联系(参见 E. Stijns 和H. Thienpont [184])。 从计算机视觉的角度来看,光子学是捕捉视觉场景中光的科学。图像处理研究数字图 像形成(如从模拟光学传感器信号到数字信号的转换)、操作(如图像滤波、去噪、裁剪)、 特征提取(如像素强度、梯度方向、梯度幅度、边缘强度)、描述(如图像边缘和纹理)和 可视化(如像素强度直方图)。可以参见B. J?hne [85]和S.G. Hoggar [81]的图像处理数学框 架,并扩展到许多相关人员对图像处理的看法,如M. Sonka、V. Hlavac 和R. Boyle [183], W. Burger 和M. J. Burge [21],R. C. 冈萨雷斯和R. E·伍兹[57],R. C. 冈萨雷斯、R. E. 伍 兹和S. L. 埃丁斯 [58],V. Hlavac [80],C. Solomon 和T. Breckon [181]。这些有用的信息, 即可以检测、分析和分类的图像目标形状和模式,为计算机视觉研究者的关注点提供了基 石(如[140])。实际上,计算机视觉是对数字化图像结构和模式的研究,而这是在图像处 理和光子学之上一层的图像分析。计算机视觉将图像处理和光子学包括在其追求图像几何 和图像区域模式的技巧集合中。 此外,培养数字图像的智能系统观点可帮助发现隐藏的模式(如图像区域的重复凸轮 廓)和嵌入的图像结构(如图像中感兴趣区域的点聚类)。通过量化器可以发现这种结构。 量化器将一组(通常是连续的)值限制为离散值。量化器在其计算机视觉里最简单的形式 中,观察特定的目标像素强度并在目标邻域中选择最接近的近似值。量化器的输出被A. Gersho 和R.M. Gray 称为码本[55,5.1 节,p.133] (另见S. Ramakrishnan、K. Rose 和A. Gersho [161])。 在图像网格叠加的上下文中,Gersho-Gray 量化器被替换为基于几何的量化器。基于几 何的量化器将图像区域限制在其外形轮廓中并在图像中观察特定的目标形状轮廓,与其他 具有近似形状的目标轮廓进行比较。在计算机视觉的基础上,基于几何的量化器观察并比 较大致相同的图像区域,例如将最大核聚类(MNC)与其他核聚类进行比较。最大核聚类 (MNC)是围绕称为核的网格多边形的图像网格多边形的集合(参见J. F. Peters 和E. ?nan 在Edelsbrunner 神经中的沃罗诺伊图像镶嵌[147])。一个图像网格核是一个网格多边形,它 是相邻多边形集合的中心。事实上,每个网格多边形都是一个多边形聚类的核。然而,只 有一个或多个网格核是最大的。 最大图像网格核是具有最高数量的相邻多边形的网格核。MNC 在计算机视觉中很重 IV 计算机视觉基础 要,因为MNC 轮廓能近似所考虑图像目标的形状。对图像的沃罗诺伊镶嵌是用多边形对 图像的拼贴。图像的沃罗诺伊镶嵌也称为沃罗诺伊网格。对图0.1(a)中音乐家图像的拼 贴样本图如图0.1(b)所示。在每个拼贴多边形内的红点( ?)是沃罗诺伊区域(多边形) 生成点的示例。更多的信息参见1.22.1 小节。这个音乐家网格核是如图0.2(b)所示最大 核聚类的中心。这是图0.1(b)中音乐家图像网格中唯一的MNC。该MNC 也是沃罗诺伊 网状神经的一个例子。对图像MNC 的研究将我们带到图像几何和图像目标形状检测的入 门处。更多内容可见1.22.2 小节。 (a)音乐家 (b)音乐家拼贴 图0.1 音乐家图像的沃罗诺伊镶嵌 (a)音乐家网格核 (b)音乐家最大网格核 图0.2 音乐家图像的最大核聚类 每个图像拼贴多边形是内部和顶点像素的凸包。一组图像点的凸包是该组点的最小凸 集。一组图像点A 是凸集,只要集合A 中任意两点之间每条直线段上的所有点都包含在集 合中。换句话说,知识发现是计算机视觉的核心。知识和对数字图像的理解可用于计算机 视觉系统的设计。在视觉系统设计中,需要理解数字图像的组成和结构以及用于分析捕获 图像的方法。 本书的重点是对光栅图像的研究。本书的续集将集中在由点(矢量),线和曲线组成的 矢量图像。每幅光栅图像基本由像素(典型的像素称为网点或网格生成点),边缘(共同的、 平行的、交叉的、凸的、凹的、直的、弯曲的、连通的、不连通的),角度(矢量角度、矢 量之间的角度、像素角度),图像几何(沃罗诺伊区域[139]、德劳内三角剖分[138]),颜色, 形状和纹理组成。许多计算机视觉和场景分析中的问题可通过找到某些隐藏或未观察到的 图像变量核结构的最可能值来解决(参见P. Kohi 和P. H. S. Torr [94])。这样的结构和变量 前 言 V 包括像素的拓扑邻域、像素集合的凸包、图像结构的接近度(和分离度)、像素梯度分布以 及描述捕获场景元素的特征矢量。 其他计算机视觉问题包括图像匹配、特征选择、最佳分类器设计、图像区域测量、兴 趣点识别、轮廓组合、分割、配准、匹配、识别、图像聚类、模式聚类,见F. Escolono、 P. Suau、B. Bonev [45]和N. Paragios、Y. Chen、O. Faugeras [136],地标点形状匹配、图像 变形、形状梯度[136],假着色、像素标记、边缘检测、几何结构检测、拓扑邻域检测、目 标识别和图像模式识别。 在计算机视觉中,重点是检测数字图像中常见的基本几何结构和物体形状。这导致了 对图像处理和图像分析基础知识以及对矢量空间和图像计算几何观点的研究。图像处理的 基础包括彩色空间、滤波、边缘检测、空间描述和图像纹理。数字图像是欧几里得空间(2-D 和3-D)的示例。因此,数字图像的矢量空间观点是其基本特征的自然结果。数字图像结 构本质上是几何或视觉拓扑结构。图像结构的示例包括图像区域、线段、生成点(例如, 洛韦关键点)、像素组、像素的邻域、半空间、像素凸集和图像像素集合的凸包。例如,这 种结构可以根据最接近选定点的图像区域或具有指定直径范围的图像区域来查看。一个图 像区域是数字图像内部的一组图像点(像素)。任何图像区域的直径是该区域中一对点之间 的最大距离。这样的结构也可以在由2-D 和3-D 图像中选定点之间连接的线段所形成的三 角形区域中找到。 这种结构也常见于2-D 和3-D 图像中由封闭的半空间所形成的点集凸包里、或如G. M· 齐格勒所称的多面体[217]里。图像半空间是一条线上方或下方的所有点的集合。在所有这 三种情况下都能获得对数字化图像的区域视图。更多有关多面体的信息参见附录B.14。 每个图像区域都有一个形状。一些区域的形状比其他区域的更有趣。有趣的图像区域 形状包含感兴趣的目标。这些图像的区域视图导致各种形式的图像分割,它们在识别图像 中的目标时具有实用价值。此外,检测感兴趣图像区域的形状可帮助发现图像模式,它们 超越了图像处理中对纹理元的研究。纹理元是一个由像素组表示的区域。更多有关形状的 信息参见附录B.18 关于形状和形状边界的介绍。 图像分析侧重于各种数字图像测量(例如,像素大小、像素邻接、像素特征值、像素 邻域、像素梯度、图像邻域的接近度)。图像分析中三种基于区域的标准方法是等值线阈值 化(二值化图像)、分水岭分割(使用从前景像素到背景区域的距离图计算)和非最大抑制 (通过抑制所有比周围像素更不可能的像素来找到局部最大值)[208]。 在图像分析中,前景和背景像素具有不同的邻接(邻域),见T. Aberra [3]。有三种基 本的邻域类型:即罗森菲尔德邻接邻域[101,169]、豪斯多夫邻域[73,74],以及J. F. Peters [140]和C. J. Henry [75,76]的描述性邻域。使用不同的几何形状,像素的邻接邻域由与给 定像素相邻的像素限定。一个像素p 的罗森菲尔德邻接邻域是一组与p 邻接的像素。邻接 邻域常用于数字图像中的边缘检测。 一个像素p 的豪斯多夫邻域由与p 的距离小于一个正数r(称为邻域半径)的所有像 素构成。一个像素p 的描述性邻域(由N(img(x, y), r 表示)由一组具有特征矢量的像素构 成,这些特征矢量与描述img(x, y)的特征矢量匹配或相似,且在规定的r 半径内。 与邻接邻域不同,描述性邻域可以拥有其中的孔,即具有与邻域中心不匹配和不属于 邻域的特征矢量的像素。其他类型的描述性邻域在[140,1.16 节,pp.29-34]中介绍。 VI 计算机视觉基础 本书的章节源于过去若干年中自己教授过的本科生计算机视觉课程的笔记。本书中的 许多主题源于自己与一些研究生和其他人员的讨论和交流,尤其是S. Ramanna(很多形状, 特别是在水晶中)、Anna Di Concilio(邻近性、区域自由几何和如图0.3 的海景形状)、Clara Guadagni(花神经结构)、Arturo Tozzi(Borsuk-Ulam 定理的见解和Gibson 形状,Avenarius 形状)、Romy Tozzi(记得8,∞)、Zdzis?aw Pawlak(波兰乡村绘画中的形状)、Lech Polkowski (那些纯粹的,拓扑的和粗糙集结构)、Piotr Artiemjew(蜻蜓翅膀)、Giangiacomo Gerla(那 些UNISA 庭院三角形和空间区域的指示(点))、Gerald Beer(Som Naimpally’s 生活中的 时刻)、Guiseppe Di Maio(关于邻近性的见解)、Somashekhar (Som) A. Naimpally(拓扑结 构)、Chris Henry(色彩空间,颜色形状集)、Macek Borkowsk(i 3-D空间观点)、Homa Fashandi, Dan Lockery,Irakli Dochviri,Ebubekir ?nan(接近关系和接近组)、Mehmet Ali ?ztürk(优 美的代数结构)、Mustafa U?kun、Nick Friesen(住宅的形状)、?zlem Umdu、Doungrat Chitcharoen、?enker Sandoz(德劳内三角化)、Surabi Tiwari(许多类别)、Kyle Fedoruk(计 算机视觉应用:斯巴鲁EyeSight?)、Amir H. Meghdadi、Shabnam Shahfar、Andrew Skowron (Banacha 的接近性)、Alexander Yurkin、Marcin Wolksi(束或滑轮)、Piotr Wasilewski、Leon Schilmoeler、Jerzy W. Grzymala-Busse(关于粗糙集和LATEX 提示的见解)、Zbigniew Suraj (Petri 网)、Jaros?aw Stepaniuk、Witold Pedrycz、Robert Thomas(倾斜的形状)、Markovi? G. oko(多形体)、Miroslaw Pawlak、Pradeepa Yahampath、Gabriel Thomas、Anthony(Tony) Szturm、Sankar K. Pal、Dean McNeill、Guiseppe(Joe)Lo Vetri、Witold Kinsner、Ken Ferens、 David Schmidt(集合论)、William Hankley(基于时间的规范)、Jack Lange(黑板拓扑涂鸦)、 Irving Sussman(定理和证明中的金块)和Brian Peters(在墙壁上稍纵即逝的几何形状一瞥)。 图0.3 沿意大利维耶特里海岸线的海景形状 我们系的技术人员非常乐于助人,尤其是Mount-First Ng,Ken Biegun,Guy Jonatschick 和Sinisa Janjic。 我的很多学生提出了有关本书主题的重要建议,特别是Drew Barclay、Braden Cross、 Binglin Li、Randima Hettiarachchi、Enoch A-iyeh、Chidoteremndu(Chido)Chinonyelum Uchime、 D. Villar、K. Marcynuk、Muhammad Zubair Ahmad 和Armina Ebrahimi。 前 言 VII 各章的问题已被分了类。以标记的问题可以迅速地回答。以标记的问题有可能 需要用喝一杯茶或咖啡的时间来完成。解决剩下的问题所需的时间各不相同。 詹姆斯F.彼得斯 温尼伯,加拿大

more >
扫描二维码
下载APP了解更多

同系列产品more >

分布式数据库系统原理(第4版)

(德)塔姆尔·厄兹叙(M
定 价:99元

查看详情
密码学与网络安全(第4版)

(印)阿图尔·卡哈特(A
定 价:79元

查看详情
数字图像的计算几何、拓扑和物理及...

(加)詹姆斯·彼得斯(J
定 价:89元

查看详情
计算机网络(第6版)

(美)安德鲁·S.特南鲍
定 价:138元

查看详情
彩色计算机视觉:基础与应用

(荷)西奥·盖维尔斯(T
定 价:69元

查看详情
图书分类全部图书
more >
  • 不仅介绍计算机视觉的基础内容,还提供了大量相应的Matlab程序,可结合原理学习进行实验,以进一步加深理解并解决实际问题。
  • 不仅介绍计算机视觉的基础内容,还提供了大量相应的Matlab程序,可结合原理学习进行实验,以进一步加深理解并解决实际问题。
more >
  • 目录

    第 1 章通往机器视觉的基础知识 . 1

    1.1 什么是计算机视觉  1

    1.2 分而治之的方法  1

    1.3 覆盖在图像上的沃罗诺伊图  4

    1.4 计算几何简介  6

    1.5 数字图像的框架  8

    1.6 数字视觉空间  12

    1.7 创建你自己的图像  12

    1.8 随机生成图像  14

    1.9 显示图像的方法  16

    1.10 数字图像的格式  17

    1.11 图像数据类型  18

    1.12 彩色图像  21

    1.12.1 彩色空间  21

    1.12.2 彩色通道  21

    1.13 彩色查找表  24

    1.14 图像几何初步  26

    1.15 访问和修改图像像素值  29

    1.16 彩色、灰度和二值图像  31

    1.17 像素的罗森菲尔德8-邻域  32

    1.18 距离:欧几里得和出租车测度  35

    1.19 假彩色:点彩派绘画  37

    1.19.1 假彩色RGB 图像模式  37

    1.19.2 假彩色灰度图像模式  39

    1.20 数字图像上的矢量空间  41

    1.20.1 点积  41

    1.20.2 图像梯度  42

    1.21 相机看见什么:智能系统视图  43

    1.21.1 相机视觉系统中的智能系统方法  43

    1.21.2 相机感知的场景彩色  44

    1.22 图像几何:图像上的沃罗诺伊和德劳内网格  47

    1.22.1 汽车图像上的沃罗诺伊网格  47

    1.22.2 沃罗诺伊图像的子网格揭示了什么信息  50

    1.23 神经结构  50

    X 计算机视觉基础

    1.23.1 汽车图像上的...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘