图书目录

目录

第1章绪论

/

1.1基本概念/

1.2发展历史/

1.3应用举例/

1.4本书概述/

第2章视觉信息获取

/

2.1射影几何与变换/

2.1.1二维射影几何与变换/

2.1.2三维射影几何与变换/

2.2摄像机模型/

2.2.1有限摄像机/

2.2.2一般射影摄像机/

2.2.3无穷远摄像机/

2.3光度测定学的图像形成/

2.3.1照明/

2.3.2反射与阴影/

2.3.3光学/

2.4深度图像与点云的获取/

2.4.1深度相机/

2.4.2激光雷达/

思考题/

第3章图像视频处理

/

3.1局部图像处理算子/

3.1.1形态学变换/

3.1.2线性滤波器/

3.1.3图像锐化与模糊/

3.1.4距离变换/

3.2全局图像处理算子/

3.2.1傅里叶变换/

3.2.2图像插值方法/

3.2.3图像几何变换/

3.2.4图像色彩空间变换/

3.2.5直方图均衡化/

3.3典型图像增广方法/

3.3.1随机仿射变换/

3.3.2随机明度/色相/饱和度变换/

3.3.3随机裁剪与拼接/

思考题/

第4章视觉特征提取

/

4.1点与块特征提取/

4.1.1自相关函数/

4.1.2自适应非最大抑制/

4.1.3尺度不变特征变换/

4.1.4梯度位置方向直方图(GLOH)/

4.1.5局部二值描述子/

4.2边缘特征提取/

4.2.1边缘提取算子/

4.2.2边缘连接问题/

4.2.3应用举例: 车道线检测/

4.3形状特征提取/

4.3.1霍夫变换/

4.3.2消失点检测/

4.3.3圆的检测/

思考题/

第5章视觉特征配准

/

5.1传统特征匹配/

5.1.1匹配距离/

5.1.2匹配策略/

5.1.3匹配评价准则/

5.2传统几何配准/

5.2.1传统几何配准方法/

5.2.2传统几何配准优化方法/

5.2.3传统几何配准评价指标/

5.2.4传统几何配准改进思路/

5.2.5应用举例: 残缺人脸识别/

5.3深度学习配准/

5.3.1基于图像的深度学习配准/

5.3.2基于点云的深度学习配准/

5.3.3基于多模态的深度学习配准/

5.4光流估计/

5.4.1LucasKanade光流法/

5.4.2代价体积/

5.4.3基于深度学习的光流估计/

5.5场景流估计/

5.5.1基于图像的场景流估计/

5.5.2基于点云的场景流估计/

思考题/

第6章三维场景重建

/

6.1由运动到结构/

6.1.1对极几何约束/

6.1.2本质矩阵估计与分解/

6.1.3三角测量/

6.1.4PnP问题与求解方法/

6.2稠密场景重建/

6.2.1基于传统几何的稠密重建方法/

6.2.2基于深度学习的稠密重建方法/

6.3深度估计/

6.3.1单目深度估计/

6.3.2多视角深度估计/

6.3.3环视深度估计/

6.4神经辐射场/

6.4.1从“场”的概念开始/

6.4.2图形学基本概念/

6.4.3神经辐射场和新视角合成/

6.4.4神经辐射场和表面重建/

6.4.5神经辐射场的其他进展/

思考题/

第7章视觉目标识别

/

7.1视觉识别概述/

7.1.1问题定义/

7.1.2系统概述/

7.2传统识别方法/

7.2.1特征提取方法/

7.2.2典型分类方法/

7.3基于卷积神经网络的目标识别/

7.3.1卷积神经网络/

7.3.2卷积神经网络的衍化/

7.3.3残差网络——ResNet/

7.3.4深度神经网络的现实与挑战/

7.4基于自注意力网络的目标识别/

7.4.1自注意力机制/

7.4.2视觉自注意力网络/

7.5基于视觉语言模型的目标识别/

思考题/

第8章视觉语义分割

/

8.1视觉语义分割任务介绍/

8.1.1语义分割/

8.1.2实例分割/

8.1.3全景分割/

8.2传统分割模型/

8.2.1基于阈值的方法/

8.2.2基于区域的分割方法/

8.2.3基于边缘的分割方法/

8.2.4基于聚类的分割方法/

8.3多模态分割模型:  二维图像分割/

8.3.1发展脉络/

8.3.2经典方法:  FCN和UNet/

8.3.3创新与发展:  网络结构与算法技术/

8.4多模态分割模型:  时序视频分割/

8.4.1关键科学问题/

8.4.2经典模型方法/

8.5多模态分割模型:  三维点云分割/

8.5.1关键科学问题/

8.5.2经典模型方法/

8.6训练方法:  半监督分割/

8.6.1半监督训练范式/

8.6.2半监督分割模型/

8.7训练方法:  无监督分割/

8.7.1全过程无监督方法/

8.7.2无监督领域自适应方法/

8.8前沿研究:  跨模态分割/

8.8.1指代分割/

8.8.2开放词汇分割/

思考题/

第9章视觉目标检测

/

9.1目标检测任务定义/

9.2传统视觉检测方法简介/

9.2.1“维奥拉琼斯”检测器/

9.2.2梯度直方图检测器/

9.2.3基于可偏移部件的检测模型/

9.2.4基于霍夫投票的检测模型/

9.3基于深度学习的检测方法/

9.3.1基于深度学习的二维图像检测/

9.3.2基于深度学习的三维点云检测/

9.3.3基于深度学习的环视图像检测/

9.4多模态融合方法/

9.4.1基于投影的多模态对齐方法/

9.4.2基于注意力机制的多模态对齐方法/

9.5其他新兴目标检测相关课题/

9.5.1旋转目标检测/

9.5.2显著性目标检测/

思考题/

第10章视觉目标跟踪

/

10.1视觉目标跟踪简介/

10.1.1视觉目标跟踪研究内容/

10.1.2视觉目标跟踪研究分类/

10.2经典视觉目标跟踪方法/

10.2.1跟踪目标的表示方法/

10.2.2确定性目标跟踪方法/

10.2.3非确定性目标跟踪方法/

10.3基于深度学习的视觉目标跟踪方法/

10.3.1深度相关滤波器跟踪/

10.3.2基于分类的深度跟踪器/

10.3.3双路网络跟踪算法/

10.3.4基于梯度优化的深度跟踪方法/

10.3.5基于Transformer的深度跟踪方法/

10.4视觉目标跟踪的常用数据集/

10.4.1OTB100/

10.4.2VOT/

10.4.3NFS/

10.4.4LaSOT/

思考题/

第11章视觉内容检索

/

11.1视觉内容检索任务介绍/

11.2传统视觉内容检索方法/

11.2.1背景与意义/

11.2.2基于文本的图像检索/

11.2.3基于内容的图像检索/

11.2.4基于内容的图像检索技术/

11.2.5近似最近邻搜索方法/

11.2.6小结/

11.3基于深度学习的视觉内容检索方法/

11.3.1基于深度度量学习的图像检索方法/

11.3.2基于深度哈希表示的图像检索方法/

11.3.3小结/

思考题/

第12章视觉内容生成

/

12.1生成对抗网络/

12.1.1基本原理/

12.1.2变体模型/

12.2变分自编码器/

12.2.1基本原理/

12.2.2变体模型/

12.3自回归模型/

12.3.1基本原理/

12.3.2变体模型/

12.4基于流的生成模型/

12.4.1归一化流模型/

12.4.2实值非体积保留模型/

12.4.3生成流模型/

12.5去噪扩散模型/

12.6多模态生成模型/

思考题/

第13章计算机视觉前沿

/

13.1大模型背景知识/

13.1.1深度学习模型发展趋势/

13.1.2大模型优势/

13.2代表性大模型/

13.2.1语言大模型/

13.2.2视觉大模型/

13.2.3多模态大模型/

13.3大模型预训练/

13.3.1双向编码视觉表示模型/

13.3.2掩膜自编码器/

13.4大模型的应用/

13.4.1具身智能/

13.4.2数字人/

13.4.3自动驾驶/

思考题/

参考文献

/