前言
总的来说,计算机视觉、文本处理、游戏对弈等深度学习最新前沿,最终目标就是使智能体能够像人一样看待和理解这个世界。本书通过介绍一个个经典案例,穿插讲解代码和其背后深度学习与其他经典算法的原理。与此同时,高度注重理论与实践的结合,充分讲解与注释代码。并且每个案例后面都给出了全面的安装步骤,以及相关的实验截图。
本书采用的深度学习工具为TensorFlow。它是最出名的开源工具,使深度学习的门槛大大降低,不管是人工智能专家,还是对深度学习不很在行的开发人员,都可以轻易利用它开发出AI程序,其2.x版本还极大地简化了代码的复杂性。
本书的主要目的就是对最前沿的几个深度学习领域进行汇总。因此,为编写此书,作者查阅了大量论文和相关文献。本书共分为四部分。
第一部分介绍基础,包括第1章和第2章。第1章介绍了深度学习环境搭建。主要围绕深度学习的基本特点和规律,以及如何搭建相关的CPU与GPU版本的平台、安装cuDNN神经网络库、匹配Python与Anaconda版本等进行介绍。第2章介绍深度学习实战的基本流程。每次通过一个案例的方式介绍结构化数据、回归方法、过拟合、保存模型等最基本的深度学习实战处理基础知识和应用流程。
第二部分主要介绍计算机视觉领域的经典案例,包括第3~6章。第3章实现了对图像的基本操作,包括增强、分类、语义分割。第4章围绕增强图像的质量展开,包括去模糊、去噪声、提高分辨率实战案例。第5章实现了不同方法的目标检测。第6章介绍YOLO、SSD以及DarkFlow,是单阶段检测的经典实战案例。
第三部分是关于文本处理与生成实战,包括第7~9章。第7章主要围绕手写体问题展开,包括神经网络、编码器、对抗样本生成、姿态生成等新的知识点。第8章进入文本创作实战,包括创作音乐、歌词、古诗。第9章主要对情感分类、翻译、对话进行实战。
第四部分主要是对抗生成网络与强化学习实战,包括第10章和第11章。其中,第10章介绍GAN,围绕生成实战串联了模仿建筑风格、相似动物转换、人脸生成等项目。第11章介绍强化学习与迁移学习在小游戏中的应用。
本书配有全套源代码和资源。代码讲解与使用方法在每节中的代码解析和安装操作两个环节中进行了明确。
本书是《实战深度学习——原理、框架及应用》的进阶学习材料。最初起源于团队自身建设的能力提升所需。我们改编了一批当前热门的应用案例作为实战化操作练习,并准备了全套源代码、数据集和使用说明等学习资源。本书随着团队新生力量的增加而不断更新,多次被作为培训教材使用且反响良好。
本书是跨域大数据智能分析与应用省级重点实验室团队协同努力的成果,由邓劲生和尹晓晴负责搭建整体框架并确定实战内容、组织验证应用和调度实施,张智超选取案例并撰写了大部分章节,陈怡、严少洁、喻庭昌参与了部分章节撰写、调试了全部代码并整理优化文字,熊炜林、王良、曹吉浩、孙睿豪等进行了核查验证及资源梳理,乔凤才、宋省身、赵涛、李勐等老师参与了文稿修改完善指导。部分内容来自于参考文献和网络资源转载,未能逐一溯源和说明引用,特在此对这些资源的作者表示感谢。
由于深度学习正处于蓬勃发展之中,而作者的自身水平、理解能力、项目经验和表达能力有限,书中难免存在一些错误和不足之处,还望各位读者不吝赐教,也欢迎将本书选作教材的老师垂询和交流,联系邮箱是bljdream@qq.com。
作者2022年1月于砚瓦池