





作者:深度学习技术及应用国家工程研究中心 百度技术培训中心 组编 罗晓燕 白浩杰 党青青 杜宇宁 张宝昌 编著
定价:69.8元
印次:1-4
ISBN:9787302623762
出版日期:2023.04.01
印刷日期:2024.08.22
图书责编:黄芝
图书分类:教材
本书在介绍深度学习、百度飞桨等相关知识的基础上,着重介绍了图像分类、目标检测、语义分割、人体关键点检测、图像生成、视频分类、图像文本检测和识别、图像识别等计算机视觉任务的实现原理及深度学习模型框架,并通过具体案例来详细介绍各任务的实现细节。 全书分为理论篇和实战篇。理论篇(第1~4章)梳理了计算机视觉技术的发展历程、主要任务、行业应用系统,同时简要介绍了深度学习开发框架、飞桨(PaddlePaddle)开发平台,以及深度学习的基础知识与网络模型架构。实战篇(第5~12章)结合计算机视觉的各个任务要求与技术发展,对其中经典的深度学习算法模型进行介绍。全书提供了实例代码,详解了在飞桨开发框架下各任务的模型实现过程。 本书适合作为高等院校人工智能、计算机视觉专业高年级本科生、研究生的教材,同时可作为计算机视觉相关任务实践教程,也可以作为科研工作者的参考书籍。
罗晓燕,副教授,博士生导师,北京航空航天大学东营研究院特聘专家。北航蓝天新秀、青年拔尖人才、航空学会航空电子与空中交通管理分会优秀青年学者。2012年在北京航空航天大学获博士学位,2012年至今在北航任教。在多谱光学图像处理、遥感图像处理、目标检测等方面取得系统性成果。在IEEE T-GRS、IEEE T-AES、IEEE T-IM、Signal Processing等国际期刊发表SCI论文23篇(其中一作/通讯18篇);申请国家发明专利16项,已授权8项。主持国家自然科学基金2项、航空科学基金与航天支撑技术基金各1项,是国家973计划、国家重大仪器专项等重大项目的研究骨干
前言 2022年我们经历了新型冠状病毒感染的反复无常、国际形势的瞬息万变,也感受了冬季奥运会的中国式浪漫,希望一切都朝着好的方向发展,一起向未来。回首整个书稿撰写历程,有对章节内容安排的困惑、对案例选择的迷茫; 也有团队协作的喜悦、内容逐步明晰的踏实。 计算机视觉(Computer Vision,CV)主要研究如何用机器来代替人类的眼睛和大脑实现对真实世界的“观察”和“理解”。在深度学习网络模型不断发展的同时,互联网上的图像数据规模有了爆发性的增长,图形处理单元(Graphic Processing Unit,GPU)性能也飞速提升,三者合力为人类带来了一场席卷全球的计算机视觉深度学习热潮。在学术界,人脸识别、目标检测等相关任务的算法得到了很好的理论优化; 在产业界,由深度学习驱动的计算机视觉已经广泛应用于智慧城市建设、医疗健康、电商与实体零售、无人驾驶等各类场景,逐步成为计算机视觉行业的支撑力量。 本书将计算机视觉及深度学习的理论基础与代码实践相结合,可以作为计算机视觉相关任务实践教程,也可以作为科研工作者的参考图书。本书内容涵盖各类计算机视觉任务的深度学习模型、案例实践基本流程和步骤。通过本书,读者可以掌握计算机视觉处理的基本概念、评价指标,熟悉视觉处理任务的具体实现过程。 全书共分为12章,分为理论篇与实战篇两部分。 第一部分为理论篇(第1~4章),首先梳理了计算机视觉技术的发展历程、主要任务、行业应用系统和常用处理工具; 其次详细介绍了目前比较流行的深度学习开发框架,重点介绍了飞桨(PaddlePaddle)开发平台的...
目录
理论篇
第1章计算机视觉概述
1.1计算机视觉技术的发展
1.2计算机视觉任务概述
1.2.1计算机视觉经典任务
1.2.2计算机视觉常见任务
1.3计算机视觉处理应用系统
1.3.1计算机视觉行业产业链
1.3.2计算机视觉行业应用系统
1.4计算机视觉处理常用工具
1.4.1OpenCV简介
1.4.2OpenCVPython
1.4.3OpenCV的基础模块
1.4.4其他CV常用工具
1.5本章小结
参考文献
第2章深度学习开发框架
2.1常见的深度学习开发框架
2.1.1TensorFlow深度学习开发框架
2.1.2PyTorch深度学习开发框架
2.1.3PaddlePaddle深度学习开发框架
2.2飞桨基础
2.2.1开发环境
2.2.2开发套件
2.2.3工具组件
2.2.4开发平台
2.3本章小结
参考文献
第3章深度学习算法基础
3.1机器学习
3.2神经网络的基本组成
3.2.1神经元
3.2.2神经网络的结构
3.3神经网络的计算
3.3.1激活函数
3.3.2正向传播
3.3.3反向传播
3.3.4优化算法
3.4卷积神经网络的基本组成
3.4.1卷积层
3.4.2池化层
3.4.3ReLU激活函数
3.4.4全连接层
3.5深度学习模型的训练技巧... 查看详情
1.覆盖全面,对于计算机视觉没有经验的读者也可以通过本书的学习掌握深度学习技术在典型计算机视觉技术领域的应用方法。
2.知行合一,重要的算法除了介绍算法原理和推导过程外,也配置了相应的实验。
3.学以致用,介绍了工业界视觉应用系统的搭建。带领读者动手搭建图像识别系统
。
4.工业经验,借鉴百度先进的视觉系统经验,做到理论和实践相结合
。
5.动手实操,本书配套实验会部署到在线深度学习运行平台AI-studio 。使用该平台读者可以非常方便的阅读、运行和修改代码,并且可以使用免费GPU资源训练模型"