计算机视觉实践(第2版)
本书提供PDF课件,理论翔实,代码精细,内容以百度飞桨为实验平台,兼具基础理论与编程实战。

作者:李轩涯、曹焯然、计湘婷

丛书名: 高等学校智能科学与技术/人工智能专业教材

定价:59元

印次:2-1

ISBN:9787302641773

出版日期:2023.12.01

印刷日期:2023.12.11

图书责编:贾斌

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用。本书涵盖计算机视觉领域的众多方面,包含图像分类、目标检测、图像分割、视频分类以及图像生成等领域,并通过大量的实践案例向读者演示如何编写计算机视觉应用程序,从而帮助读者深入理解计算机视觉的核心概念和技术。 本书可以作为一本实用的计算机视觉实践指南,无论对于从事计算机视觉领域的专业人士,还是对计算机视觉感兴趣的初学者,本书都值得阅读和收藏。

李轩涯,博士,毕业于国防科技大学、北京理工大学。百度校园高校合作部总监,中国计算机学会杰出会员、常务理事,中国计算机实践教育联合会副理事长。现主管百度校企合作、校企联合人才培养、校园粉丝生态圈,帮助百度技术、人才及产品品牌在高校领域的推广与影响力传播。

前言 计算机视觉是人工智能的重要分支领域,随着人工智能的飞速发展,计算机视觉在人们生活中的应用也越来越广泛,从教育、安防、交通到智能家居等方方面面都有应用。然而,在实际应用中,我们需要了解如何将计算机视觉技术应用到具体场景中,这也是本书的重点所在。 本书不仅涵盖了计算机视觉领域的核心技术,而且着重介绍了计算机视觉在实际应用中的具体实现。在深度学习框架的选择上,本书采用百度开源的PaddlePaddle深度学习框架(飞桨),其作为一个易用、高效、灵活、可扩展的深度学习框架,能够帮助读者更好地理解计算机视觉技术的应用和实现。 本书共6章。第1章介绍Python基础。通过九九乘法表、随机数生成与排序等6个Python实践,帮助初学者快速掌握Python的相关语法,为后续章节的学习做铺垫。 第2章介绍图像分类。图像分类是计算机视觉领域的经典任务,是指给定输入图像,需要输出预测的图像所属类别。本章主要基于不同的分类模型,如VGG、ResNet,并在不同的数据集上完成分类任务。 第3章介绍目标检测。目标检测指需要找到图像中所有感兴趣的目标,并输出它们的类别和位置,这也是计算机视觉领域的核心任务。本章需要基于不同的检测模型,例如Faster RCNN以及YOLOV3,完成瓷砖瑕疵和昆虫等检测。 第4章介绍图像分割。图像分割是图像理解的重要组成部分,需要在像素级上完成图像分类的任务。通过学习本章,读者将了解典型的分割模型在不同分割任务上的效果。 第5章介绍视频分类。视频分类相比于图像分类更为复杂,是指给定一个视频片段...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1章Python基础

1.1实践一:  九九乘法表

1.2实践二:  随机数生成与排序

1.3实践三:  批量文件遍历、复制、重命名

1.4实践四:  图像直方图统计

1.5实践五:  数据统计分析及可视化

1.6实践六:  图像预处理

第2章图像分类

2.1实践一:  基于深度神经网络的宝石分类

2.2实践二:  基于卷积神经网络的美食识别

2.3实践三:  基于VGG系列网络的场景图像分类

2.4实践四:  基于ResNet系列模型的车辆图像分类实践

2.5实践五:  基于Vision Transformer的CIFAR10分类

第3章目标检测

3.1实践一:  基于Faster RCNN模型的瓷砖瑕疵检测(两阶段目标检测)

3.2实践二:  基于YOLOV3/PPYOLO模型的昆虫检测(一阶段目标检测)

3.3实践三:  基于DETR模型的目标检测

第4章图像分割

4.1实践一:  基于UNet/DeepLabV3 Plus模型的宠物图像分割

4.2实践二:  基于PaddleSeg的人像视频分割

4.3实践三:  基于PSPNet模型的人体图像分割

4.4实践四:  基于SwinUNet模型的医学图像分割

第5章视频分类

5.1实践一:  基于TSN模型的视频分类

5.2实践二:  基于ECO模型的视频分类

5.3实践三:  基于TimeSformer模型的视频分类

第6章图像...

本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用,理论翔实,实用性极强。