前 言
图像处理和模式识别作为计算机视觉和人工智能领域的重要组成部分,不仅是国家重点发展的领域,也是多学科交叉的产物,涉及数学、计算机、电子等多个领域,对于培养学生的综合素质和提高解决复杂工程问题的能力具有至关重要的作用。在这一快速发展的学科中,新理论和新方法层出不穷,持续不断地为我们揭示更广阔的应用前景。
本书的主要目的是介绍数字图像处理与模式识别的概念和方法。本书将图像处理和模式识别的理论和实践相结合,既突出了理论的基础地位,又强调了实践在人才培养中的关键作用。在理论环节,既包含经典算法,也包含本领域较新的进展。在实践环节,既包含基于Python 编程语言和OpenCV 的软件实现,也包含基于嵌入式硬件平台的部署。
本教材面向通信工程、电子信息工程、人工智能、数据科学与大数据技术、计算机科学与技术等专业的本科生和研究生,适用于数字图像处理、计算机视觉、模式识别、机器学习等课程。针对初学者,本书提供数字图像和模式识别基础知识,介绍相关算法的实现流程。本书的内容不仅基于数学分析、线性代数、概率统计、线性系统等专业知识,还包含计算机Python 编程以及OpenCV 计算机视觉库,更方便对此有一定了解和掌握的读者在学习本书的过程中上手练习。针对感兴趣的读者,本书设置了开放习题供读者练习,旨在使本书成为提高研究能力的助推器。
本书包含三部分:实践环境、图像处理实践及模式识别实践。
第Ⅰ部分“实践环境”首先介绍硬件基础,包含一些常见的硬件平台,如PC 平台或嵌入式硬件平台(VIM3、树莓派和RV1126 等)。针对这些硬件平台的特点和优势进行展开介绍,以便读者在本书实践内容学习前对硬件知识和能力有一定了解和掌握。随后介绍实践需要的软件基础,包含Python 语法以及OpenCV 计算机视觉库的使用。编程基础薄弱和零基础的读者,可以从中了解一些相关基础内容。
第Ⅱ部分“图像处理实践”主要针对数字图像处理基础进行理论介绍和实践操作,内容包含基础操作、几何变换、图像滤波、边缘检测和特征提取与匹配,以及针对图像处理领域的常见问题,实现图像特征提取和分析。
第Ⅲ部分“模式识别实践”要介绍5 个应用案例,如人脸识别应用、目标跟踪应用、文本识别应用、条形码与二维码识别应用、基于视觉的机械臂应用。针对每一个应用介绍相应的理论基础和实现过程,旨在提高实践者的系统观。
感谢张哲、余俊、王泽浩、李子贺、刘宇同、王涵、刘永基、宣臣焜等在本书组织和代码测试等方面的工作。
在本书的编写过程中,我们参考了国内外数字图像处理和模式识别研究领域的文献和书籍,在此谨向相关书籍和文献的作者表示真挚的感谢。
由于作者知识和能力有限,书中难免存在不妥之处,敬请同行专家和读者批评指正。
本书相关课件与代码资源,大家可以扫码获得。