前言
深度学习对解决图像检索问题有着不可替代的优势。本书将理论与实践结合,以城市道路中跨摄像头、跨场景下的车辆图像检索问题贯穿全文,深入讲解深度学习中物体识别、目标检测、迁移学习、图像生成、超分辨率重建、多模型融合等算法原理,以及这些算法在车辆图像检索中的应用实践,有助于拓宽读者的研究思路并提升解决实际问题的能力。
本书旨在探索多种深度学习算法从不同角度解决图像检索问题的有效性,实用性强,可帮助读者快速入门、掌握、实践前沿的图像检索任务,适用于从事深度学习图像检索技术及应用研究的相关人员阅读。
本书共8章,分为两篇。第一篇为图像检索基础,包括第1~3章。第1章介绍图像检索技术的研究背景、研究内容以及研究方法; 第2章讲述神经网络的相关知识、深度学习的主要算法原理以及常用的深度学习框架; 第3章介绍深度学习在图像检索中的最新研究进展。第二篇为图像检索应用,包括第4~8章,重点讲述基于深度学习的车辆图像检索任务,是本书的核心内容。第4章介绍一种基于连接合并卷积神经网络的快速车辆检测方法,是车辆图像检索的前期工作; 第5章研究一种基于迁移学习场景自适应的车辆图像检索方法,通过转换源域与目标域车辆图像之间的风格,实现跨域场景下的车辆图像检索; 第6章讲述一种基于多视角图像增强的车辆图像检索方法,通过生成对抗网络将单一视角的车辆图像转换成多个视角的相同身份的车辆图像,利用增强的车辆特征,提升车辆图像检索的性能; 第7章介绍一种基于车牌图像超分辨率重建的车辆图像检索方法,通过车牌检测、车牌图像超分辨率重建、车牌验证等过程,显著提升车辆图像检索的效果; 第8章探索一种多模型融合的渐进式车辆图像检索框架,将车辆检测模型和多个车辆检索模型相结合,形成由粗到细的渐进式的车辆图像检索方法。
本书的出版得到河南省重点研发与推广专项(科技攻关)项目(222102240045)、河南省高等学校重点科研项目(22A520028)、河南省高校基本科研业务费专项项目(NSFRF210342)、河南理工大学博士基金(B202139)、河南理工大学高等学校教育教学改革研究与实践项目(2021JG099)的资助。
诚挚感谢中国矿业大学(北京)杨峰教授,中国矿业大学袁冠教授,河南理工大学沈记全教授、孙君顶教授、于金霞教授、赵珊教授的宝贵建议和耐心指导,感谢清华大学出版社盛东亮老师对本书的大力支持和无私帮助。
由于作者水平有限,书中难免有疏漏和不足之处,恳请读者批评指正!
作者
2022年4月