





作者:言有三
定价:159元
印次:1-1
ISBN:9787302635277
出版日期:2023.07.01
印刷日期:2023.07.26
图书责编:王中英
图书分类:零售
《深度学习之图像识别:核心算法与实战案例(全彩版)》全面介绍了深度学习在图像识别领域中的核心算法与应用。该书不但重视基础理论的讲解,而且从第4章开始,每章都提供了1~3个不同难度的案例供读者实践,读者可以在已有代码的基础上进行改进,从而加深对所学知识的理解。 《深度学习之图像识别:核心算法与实战案例(全彩版)》共9章:首先介绍深度学习的基础概念,包括神经网络基础知识和深度学习中的优化技术;然后系统介绍深度学习中与数据相关的知识,包括经典数据集的设计、数据集的增强,以及数据的获取、整理与可视化;接着重点针对图像识别领域,结合实战案例系统地介绍深度学习在图像分类、图像分割和目标检测3个领域的核心技术与应用;另外,还会对深度学习模型的可视化以及模型的压缩和优化进行详细介绍,为读者设计和训练更加实用的模型提供指导;最后以微信小程序平台为依托,介绍微信小程序前后端开发技术,从而完成深度学习模型的部署。 《深度学习之图像识别:核心算法与实战案例(全彩版)》理论结合实践,广度兼具深度,非常适合深度学习领域的相关技术人员与爱好者阅读,尤其适合基于深度学习的计算机视觉从业人员阅读,可以帮助他们全方位了解深度学习在计算机视觉领域的技术全貌。另外,该书还适合作为高校人工智能相关专业的教材和社会培训机构相关课程的教材。
配书资源有三种获取方式: 1. 关注微信公众号“方大卓越”,回复“图像识别yys”,即可获取下载链接 2. 直接通过下载链接获取: https://pan.baidu.com/s/1rNhcyvRtS51YhClzuMVJbQ 提取码: 3nri 3. 在“有三AI”社区的开源GitHub上进行下载,下载网址:https://github.com/longpeng2008/yousan.ai 编辑推荐 凝聚知名图像处理专家8年深度学习算法的研究心得和实践经验 中科院研究员鲁华祥、阿里达摩院计算机视觉大模型负责人赵德丽等专家力荐 全面、深入介绍基于深度学习的图像识别技术与应用 深入介绍图像识别的核心算法与12个经典案例 重点突出计算机视觉领域的多项新技术研究成果 ------------------------------------------------------------- 本书特色 l 印刷精美:采用全彩印刷,能更好地呈现图像的色彩和各种细节。 l 内容全面、新颖:涵盖深度学习与图像识别的核心技术与应用,并重点介绍多项新技术研究成果,给出多个重要领域的应用实践代码。 l 讲解深入:在对内容横向扩展的同时,还进一步从纵向挖掘,力争把知识讲深、讲透。 l 讲解准确、细致:对涉及的概念和算法等理论知识给出准确的描述,并通过大量的示意图、表和详细的步骤呈现技术细节。 l 框架流行、易用:涉及的所有案例均采用流行和易用的PyTorch框架实现,容易上手。 l 理论和实践紧密结合,案例典型:不仅对理论知识进行阐述,而且结合12个切合实际开发的典型案例进行实践,学习效果更好。 l 编排科学:章节顺序编排合理,符合读者的学习和认知规律,学习梯度较为平滑。------------------------------------------------------------ 作者简介 言有三,真名龙鹏。2012年毕业于华中科技大学,获本科学历,后保研至中国科学院,于2015年毕业。阿里云MVP,华为云MVP。先后在奇虎360人工智能研究院和陌陌深度学习实验室从事计算机视觉的相关工作,积累了丰富的传统图像处理算法研究心得和深度学习项目实战经验。运营微信公众号“有三AI”等社区,内容覆盖深度学习的理论、开源框架、模型架构设计与优化,以及深度学习在计算机视觉和自然语言处理等领域的核心技术与应用。规划并总结了AI算法工程师完整的成长路线。出版了《深度学习之图像识别:核心技术与案例实战》《深度学习之模型设计:核心算法与案例实践》《深度学习之人脸图像处理:核心算法与案例实战》《深度学习之摄影图像处理:核心算法与案例精粹》《生成对抗网络GAN:原理与实践》等著作。
前言 机器学习、深度学习和人工智能是近几年持续热门的话题,尤其是OpenAI公司的ChatGPT聊天机器人一上线,便把人工智能推向了一个新的热度。深度学习其实并不是一门全新的学科,其历史可以追溯到20世纪40年代,其背后的核心技术包括神经网络的结构设计和优化方法等。深度学习是一门应用性极强的工程技术,初学者要想掌握好这门技术,不仅需要进行系统的理论知识学习,而且还要紧随理论进行全面实践。 对于我国而言,人工智能俨然已经成为国家高科技发展的重中之重,近几年有数百所高等院校陆续开设了人工智能类专业。当前,令人瞩目的是以深度学习为代表的无监督特征学习技术在图像识别、语音识别和自然语言处理等领域频频取得新的突破,这促使我国数以千计的人工智能类科技公司得到了快速发展。 笔者在8年前就投身人工智能领域,从事图像识别方面的工作。在此期间,笔者多以深度学习技术为基础进行相关项目的开发,积累了大量的经验,而且还持续运营微信公众号“有三AI”,推出了数百篇与人工智能相关的文章,帮助大量读者了解和学习人工智能相关技术及发展趋势。 笔者曾在2019年5月出版了《深度学习之图像识别:核心技术与案例实战》,迄今已经5次印刷,销量超过万册,被众多读者所认可。只是这是笔者第一次执笔写作,当时笔者还在互联网公司上班,时间非常紧,加之自身能力不足,所写内容还不算太成熟和完备,仍然有大量可以改进、扩展和深入的空间。近几年,笔者进一步对相关技术进行了潜心研究和实践,对基于深度学习的图像识别技术有了更加深入和全面的认识,技术能力突飞猛进,其间还写作并出版了几本人工智能技术图书,还与大量读者和技术爱好者进行过...
1.1 神经网络的生物基础与数学模型 1
1.1.1 神经元 1
1.1.2 感知机 3
1.1.3 多层感知机与反向传播算法 7
1.2 卷积神经网络基础 11
1.2.1 卷积的概念 12
1.2.2 卷积神经网络的基本概念 13
1.2.3 卷积神经网络的基本结构 17
1.3 总结 21
参考文献 22
第2章 深度学习优化基础 23
2.1 激活函数 23
2.1.1 S型函数 24
2.1.2 ReLU函数 25
2.2 参数初始化 31
2.2.1 简单初始化 31
2.2.2 标准初始化 31
2.2.3 Xavier与MSRA初始化 32
2.2.4 初始化方法的使用 32
2.3 标准化方法 33
2.3.1 什么是标准化 33
2.3.2 批次标准化 34
2.3.3 层标准化 37
2.3.4 实例标准化 37
2.3.5 组标准化 38
2.3.6 权重标准化 39
2.3.7 标准化方法的自动搜索 39
2.3.8 标准化的有效性问题 39
2.4 学习率与最优化 40
2.4.1 学习率策略 40
2.4.2 梯度下降法与动量法 45
2.4.3 Adagrad算法 46
2.4.4 Adadelta与RMSprop算法 47
2.4.5 Adam算法 47
2.4.6 牛顿法、拟牛顿法与共轭梯度法 48
2.5 正则化方法与泛化 48
2.5.1 过拟合与欠拟合...
本书赞誉
本书作者是一位在深度学习图像识别领域工作多年的有为青年,他根据自己的工作经历和经验编写了这本书。本书以理论结合案例的方式系统地介绍计算机视觉中的图像分类、目标检测和图像分割几个核心方向的研究方法,并对模型的可视化分析和压缩方法进行比较深入的介绍,是一本不可多得的图像识别技术读物,推荐对深度学习和图像识别技术感兴趣的人阅读,一定大有裨益。
——中国科学院半导体研究所研究员 鲁华祥
本书对深度学习的基础知识做了详细的介绍,并且配了大量的示意图,做到了图文并茂,读起来通俗易懂。本书知识和实践并重,结合多个具体的应用案例讲解,适合学习深度学习基础知识和常见理解类任务的读者阅读。本书作者著有多本相关技术图书,经验丰富,相信这本图像识别图书会给AI的普及带来助力。
——阿里巴巴达摩院计算机视觉大模型负责人 赵德丽
一个好的算法工程师必须要有扎实的理论基础和丰富的实战经验。本书重点介绍了计算机视觉领域近几年的一些新进展,另外还详细地阐述了如何完成工业界的一些实用且通用的视觉任务。如果你想要成为一名计算机视觉算法工程师,那么建议你系统地阅读本书,在作者的引领下提高自己的水平。
——虾皮技术总监 陈强
随着多模态大模型技术的发展,AI的能力也在不断地进化,我们即将进入真正的AI时代。言有三的这本书以感知世界的视觉图像分析算法为切入口,系统地介绍了图像识别技术,是学习该项技术的一块很好的敲门砖。该书对图像识别领域多个实际任务的数据集、任务目标、基本方法和工具框架进行了详细介绍,是学习图像识别技术不可多得的参考读物。通过阅读本书,读者可以快速理解深度学习的基础概念和理论,并跟随书中的实战案例亲自动手实践,从而提高实际动手能力,提升学习效果。
——高途AI算法负责人 邱学侃