目录
第1章绪论
/
1.1基本概念/
1.2发展历史/
1.3应用举例/
1.4本书概述/
第2章视觉信息获取
/
2.1射影几何与变换/
2.1.1二维射影几何与变换/
2.1.2三维射影几何与变换/
2.2摄像机模型/
2.2.1有限摄像机/
2.2.2一般射影摄像机/
2.2.3无穷远摄像机/
2.3光度测定学的图像形成/
2.3.1照明/
2.3.2反射与阴影/
2.3.3光学/
2.4深度图像与点云的获取/
2.4.1深度相机/
2.4.2激光雷达/
思考题/
第3章图像视频处理
/
3.1局部图像处理算子/
3.1.1形态学变换/
3.1.2线性滤波器/
3.1.3图像锐化与模糊/
3.1.4距离变换/
3.2全局图像处理算子/
3.2.1傅里叶变换/
3.2.2图像插值方法/
3.2.3图像几何变换/
3.2.4图像色彩空间变换/
3.2.5直方图均衡化/
3.3典型图像增广方法/
3.3.1随机仿射变换/
3.3.2随机明度/色相/饱和度变换/
3.3.3随机裁剪与拼接/
思考题/
第4章视觉特征提取
/
4.1点与块特征提取/
4.1.1自相关函数/
4.1.2自适应非最大抑制/
4.1.3尺度不变特征变换/
4.1.4梯度位置方向直方图(GLOH)/
4.1.5局部二值描述子/
4.2边缘特征提取/
4.2.1边缘提取算子/
4.2.2边缘连接问题/
4.2.3应用举例: 车道线检测/
4.3形状特征提取/
4.3.1霍夫变换/
4.3.2消失点检测/
4.3.3圆的检测/
思考题/
第5章视觉特征配准
/
5.1传统特征匹配/
5.1.1匹配距离/
5.1.2匹配策略/
5.1.3匹配评价准则/
5.2传统几何配准/
5.2.1传统几何配准方法/
5.2.2传统几何配准优化方法/
5.2.3传统几何配准评价指标/
5.2.4传统几何配准改进思路/
5.2.5应用举例: 残缺人脸识别/
5.3深度学习配准/
5.3.1基于图像的深度学习配准/
5.3.2基于点云的深度学习配准/
5.3.3基于多模态的深度学习配准/
5.4光流估计/
5.4.1LucasKanade光流法/
5.4.2代价体积/
5.4.3基于深度学习的光流估计/
5.5场景流估计/
5.5.1基于图像的场景流估计/
5.5.2基于点云的场景流估计/
思考题/
第6章三维场景重建
/
6.1由运动到结构/
6.1.1对极几何约束/
6.1.2本质矩阵估计与分解/
6.1.3三角测量/
6.1.4PnP问题与求解方法/
6.2稠密场景重建/
6.2.1基于传统几何的稠密重建方法/
6.2.2基于深度学习的稠密重建方法/
6.3深度估计/
6.3.1单目深度估计/
6.3.2多视角深度估计/
6.3.3环视深度估计/
6.4神经辐射场/
6.4.1从“场”的概念开始/
6.4.2图形学基本概念/
6.4.3神经辐射场和新视角合成/
6.4.4神经辐射场和表面重建/
6.4.5神经辐射场的其他进展/
思考题/
第7章视觉目标识别
/
7.1视觉识别概述/
7.1.1问题定义/
7.1.2系统概述/
7.2传统识别方法/
7.2.1特征提取方法/
7.2.2典型分类方法/
7.3基于卷积神经网络的目标识别/
7.3.1卷积神经网络/
7.3.2卷积神经网络的衍化/
7.3.3残差网络——ResNet/
7.3.4深度神经网络的现实与挑战/
7.4基于自注意力网络的目标识别/
7.4.1自注意力机制/
7.4.2视觉自注意力网络/
7.5基于视觉语言模型的目标识别/
思考题/
第8章视觉语义分割
/
8.1视觉语义分割任务介绍/
8.1.1语义分割/
8.1.2实例分割/
8.1.3全景分割/
8.2传统分割模型/
8.2.1基于阈值的方法/
8.2.2基于区域的分割方法/
8.2.3基于边缘的分割方法/
8.2.4基于聚类的分割方法/
8.3多模态分割模型: 二维图像分割/
8.3.1发展脉络/
8.3.2经典方法: FCN和UNet/
8.3.3创新与发展: 网络结构与算法技术/
8.4多模态分割模型: 时序视频分割/
8.4.1关键科学问题/
8.4.2经典模型方法/
8.5多模态分割模型: 三维点云分割/
8.5.1关键科学问题/
8.5.2经典模型方法/
8.6训练方法: 半监督分割/
8.6.1半监督训练范式/
8.6.2半监督分割模型/
8.7训练方法: 无监督分割/
8.7.1全过程无监督方法/
8.7.2无监督领域自适应方法/
8.8前沿研究: 跨模态分割/
8.8.1指代分割/
8.8.2开放词汇分割/
思考题/
第9章视觉目标检测
/
9.1目标检测任务定义/
9.2传统视觉检测方法简介/
9.2.1“维奥拉琼斯”检测器/
9.2.2梯度直方图检测器/
9.2.3基于可偏移部件的检测模型/
9.2.4基于霍夫投票的检测模型/
9.3基于深度学习的检测方法/
9.3.1基于深度学习的二维图像检测/
9.3.2基于深度学习的三维点云检测/
9.3.3基于深度学习的环视图像检测/
9.4多模态融合方法/
9.4.1基于投影的多模态对齐方法/
9.4.2基于注意力机制的多模态对齐方法/
9.5其他新兴目标检测相关课题/
9.5.1旋转目标检测/
9.5.2显著性目标检测/
思考题/
第10章视觉目标跟踪
/
10.1视觉目标跟踪简介/
10.1.1视觉目标跟踪研究内容/
10.1.2视觉目标跟踪研究分类/
10.2经典视觉目标跟踪方法/
10.2.1跟踪目标的表示方法/
10.2.2确定性目标跟踪方法/
10.2.3非确定性目标跟踪方法/
10.3基于深度学习的视觉目标跟踪方法/
10.3.1深度相关滤波器跟踪/
10.3.2基于分类的深度跟踪器/
10.3.3双路网络跟踪算法/
10.3.4基于梯度优化的深度跟踪方法/
10.3.5基于Transformer的深度跟踪方法/
10.4视觉目标跟踪的常用数据集/
10.4.1OTB100/
10.4.2VOT/
10.4.3NFS/
10.4.4LaSOT/
思考题/
第11章视觉内容检索
/
11.1视觉内容检索任务介绍/
11.2传统视觉内容检索方法/
11.2.1背景与意义/
11.2.2基于文本的图像检索/
11.2.3基于内容的图像检索/
11.2.4基于内容的图像检索技术/
11.2.5近似最近邻搜索方法/
11.2.6小结/
11.3基于深度学习的视觉内容检索方法/
11.3.1基于深度度量学习的图像检索方法/
11.3.2基于深度哈希表示的图像检索方法/
11.3.3小结/
思考题/
第12章视觉内容生成
/
12.1生成对抗网络/
12.1.1基本原理/
12.1.2变体模型/
12.2变分自编码器/
12.2.1基本原理/
12.2.2变体模型/
12.3自回归模型/
12.3.1基本原理/
12.3.2变体模型/
12.4基于流的生成模型/
12.4.1归一化流模型/
12.4.2实值非体积保留模型/
12.4.3生成流模型/
12.5去噪扩散模型/
12.6多模态生成模型/
思考题/
第13章计算机视觉前沿
/
13.1大模型背景知识/
13.1.1深度学习模型发展趋势/
13.1.2大模型优势/
13.2代表性大模型/
13.2.1语言大模型/
13.2.2视觉大模型/
13.2.3多模态大模型/
13.3大模型预训练/
13.3.1双向编码视觉表示模型/
13.3.2掩膜自编码器/
13.4大模型的应用/
13.4.1具身智能/
13.4.2数字人/
13.4.3自动驾驶/
思考题/
参考文献
/
