





定价:59元
印次:2-1
ISBN:9787302641773
出版日期:2023.12.01
印刷日期:2023.12.11
图书责编:贾斌
图书分类:教材
本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用。本书涵盖计算机视觉领域的众多方面,包含图像分类、目标检测、图像分割、视频分类以及图像生成等领域,并通过大量的实践案例向读者演示如何编写计算机视觉应用程序,从而帮助读者深入理解计算机视觉的核心概念和技术。 本书可以作为一本实用的计算机视觉实践指南,无论对于从事计算机视觉领域的专业人士,还是对计算机视觉感兴趣的初学者,本书都值得阅读和收藏。
李轩涯,博士,毕业于国防科技大学、北京理工大学。百度校园高校合作部总监,中国计算机学会杰出会员、常务理事,中国计算机实践教育联合会副理事长。现主管百度校企合作、校企联合人才培养、校园粉丝生态圈,帮助百度技术、人才及产品品牌在高校领域的推广与影响力传播。
前言 计算机视觉是人工智能的重要分支领域,随着人工智能的飞速发展,计算机视觉在人们生活中的应用也越来越广泛,从教育、安防、交通到智能家居等方方面面都有应用。然而,在实际应用中,我们需要了解如何将计算机视觉技术应用到具体场景中,这也是本书的重点所在。 本书不仅涵盖了计算机视觉领域的核心技术,而且着重介绍了计算机视觉在实际应用中的具体实现。在深度学习框架的选择上,本书采用百度开源的PaddlePaddle深度学习框架(飞桨),其作为一个易用、高效、灵活、可扩展的深度学习框架,能够帮助读者更好地理解计算机视觉技术的应用和实现。 本书共6章。第1章介绍Python基础。通过九九乘法表、随机数生成与排序等6个Python实践,帮助初学者快速掌握Python的相关语法,为后续章节的学习做铺垫。 第2章介绍图像分类。图像分类是计算机视觉领域的经典任务,是指给定输入图像,需要输出预测的图像所属类别。本章主要基于不同的分类模型,如VGG、ResNet,并在不同的数据集上完成分类任务。 第3章介绍目标检测。目标检测指需要找到图像中所有感兴趣的目标,并输出它们的类别和位置,这也是计算机视觉领域的核心任务。本章需要基于不同的检测模型,例如Faster RCNN以及YOLOV3,完成瓷砖瑕疵和昆虫等检测。 第4章介绍图像分割。图像分割是图像理解的重要组成部分,需要在像素级上完成图像分类的任务。通过学习本章,读者将了解典型的分割模型在不同分割任务上的效果。 第5章介绍视频分类。视频分类相比于图像分类更为复杂,是指给定一个视频片段...
第1章Python基础
1.1实践一: 九九乘法表
1.2实践二: 随机数生成与排序
1.3实践三: 批量文件遍历、复制、重命名
1.4实践四: 图像直方图统计
1.5实践五: 数据统计分析及可视化
1.6实践六: 图像预处理
第2章图像分类
2.1实践一: 基于深度神经网络的宝石分类
2.2实践二: 基于卷积神经网络的美食识别
2.3实践三: 基于VGG系列网络的场景图像分类
2.4实践四: 基于ResNet系列模型的车辆图像分类实践
2.5实践五: 基于Vision Transformer的CIFAR10分类
第3章目标检测
3.1实践一: 基于Faster RCNN模型的瓷砖瑕疵检测(两阶段目标检测)
3.2实践二: 基于YOLOV3/PPYOLO模型的昆虫检测(一阶段目标检测)
3.3实践三: 基于DETR模型的目标检测
第4章图像分割
4.1实践一: 基于UNet/DeepLabV3 Plus模型的宠物图像分割
4.2实践二: 基于PaddleSeg的人像视频分割
4.3实践三: 基于PSPNet模型的人体图像分割
4.4实践四: 基于SwinUNet模型的医学图像分割
第5章视频分类
5.1实践一: 基于TSN模型的视频分类
5.2实践二: 基于ECO模型的视频分类
5.3实践三: 基于TimeSformer模型的视频分类
第6章图像...