图书前言

数字图像处理是计算机视觉领域的主要应用场景之一。近年来随着人工智能技术的进一步发展,数字图像处理技术得到了快速发展。特别是以深度学习为主的图像处理已经达到或接近人类视觉的识别水平,解决了长期以来图像处理的各种难题。

PyTorch是一款流行的深度学习框架,它以Python作为编程语言,以张量运算为中心集成了深度学习的各种算子,能够方便、快捷地构造复杂的深度学习模型,已经成为数字图像处理的重要工具之一。PyTorch框架的优点众多,即可以将其作为高效的张量计算模块,轻松地实现经典的数字图像处理算法,并最大限度地利用CUDA等硬件资源加速模型的训练和部署,又可以利用其自动梯度和动态图机制构造复杂的深度学习模型,从而解决高级图像处理的各种问题。当前,PyTorch在学术界和工业界得到了广泛的使用,已经成为学习数字图像处理的必学工具。熟练使用PyTorch进行数字图像处理已经成为图像处理和计算机视觉等相关岗位的必要条件。

目前,虽然图书市场上已有多本计算机视觉方面的图书,其中不乏传统数字图像处理方法的图书,但是尚缺少系统介绍PyTorch数字图像处理的图书。于是笔者编写了本书,希望能对想系统学习PyTorch数字图像处理技术的相关人员有所帮助。

本书特色

? 内容丰富:不但介绍PyTorch的基础知识和数字图像处理的相关理论,而且从张量的维度详解经典数字图像处理算法,并从深度学习的维度详解图像分类、图像分割和图像检测三大核心任务。

? 学习门槛低:从计算机视觉和数字图像的基本概念开始讲解,继而介绍开发环境的搭建、Python基础知识和PyTorch基础知识等,不需要读者有太多基础知识即可快速入门。

? 理论结合实践:不但对数字图像处理的主流算法理论进行系统讲解,而且在此基础上结合丰富的实战案例,用PyTorch深度学习框架进行应用实践。

? 图文并茂:结合多幅示意图讲解相关知识点,让抽象的知识变得更加直观和易于理解,从而帮助读者高效学习。

? 实用性强:结合大量真实的图像处理案例进行讲解,读者只需要对书中的案例源代码进行少量的改动,即可将其应用于自己的图像处理工作中。

? 配套资源丰富:提供高清教学视频、程序源代码和教学PPT等配套资源,便于读者高效、直观地学习,从而取得更好的学习效果。

本书内容

第1篇  图像处理基础知识

第1章计算机视觉与数字图像概述,主要介绍计算机视觉与数字图像的概念,以及数字图像的存储和处理,并简单介绍PyTorch框架在图像处理中的应用。

第2章搭建开发环境,首先简单介绍Python和CUDA的相关知识,然后详细介绍Python第三方库、PyTorch框架、可视化工具Visdom和集成开发环境Spyder的安装方法。

第3章Python编程基础,主要介绍Python语法基础知识、PyTorch张量运算基础知识和Visdom图表绘制基础知识。

第2篇  基于经典方法的图像处理

第4章图像处理基础知识,主要介绍图像与张量的互操作、图像的点运算、图像的邻域运算和图像的全局运算等相关知识。

第5章图像的基础特征,主要介绍图像的特征点、线特征和面特征等相关知识。

第6章自动梯度与神经网络,主要介绍自动梯度、模块、激活函数、损失函数、优化器和全连接神经网络等相关知识。

第7章数据准备与图像预处理,首先对Torchvision库进行简单介绍,然后对构建数据集、数据变换与增强进行详细的介绍。

第3篇  基于深度学习的图像处理

第8章图像分类,首先介绍图像分类的任务与预训练模型的使用,然后介绍VGGNet和ResNet两个经典的卷积神经网络模型,接着介绍卷积神经网络的训练与评估,最后简单介绍迁移学习的相关知识。

第9章图像分割,首先简单介绍图像分割的概念和卷积神经网络在该领域的进展情况,然后详细介绍分割数据集、FCN分割模型、UNet分割模型、分割网络的训练与评估等相关知识,最后进行分割网络实践。

第10章目标检测,首先简单介绍目标检测的概念和卷积神经网络在该领域的进展情况,然后详细介绍预训练网络的使用、FCOS模型及其训练、YOLOv5模型及其训练等相关知识。

第11章模型部署,首先简单介绍模型部署的特点,然后详细介绍如何使用LibTorch、ONNX、OpenCV和OpenVINO部署模型等相关知识。

读者对象

? 数字图像处理入门人员;

? 数字图像处理从业人员;

? 数字图像处理研究人员;

? 数字图像处理技术爱好者;

? 计算机视觉研究人员和爱好者;

? 高等院校相关专业的学生和老师;

? 社会培训机构的学员。

配套资源获取

本书提供的教学视频、程序源代码和教学PPT等配套资源有两种获取方式:一是关注微信公众号“方大卓越”,回复数字“28”获取下载链接;二是在清华大学出版社网站(www.tup.com.cn)上搜索到本书,然后在本书页面上找到“资源下载”栏目,单击“网络资源”或“课件下载”按钮进行下载。

售后支持

由于笔者水平所限,书中可能还存在疏漏与不足之处,恳请广大读者批评与指正。读者在阅读本书的过程中若有疑问,可发电子邮件到bookservice2008@163. com获得帮助。

侯伟

2024年7月