首页 > 图书中心 >图书详情
大数据与人工智能技术(微课视频版)
作者:主编:吕云翔 钟巧灵 副主编:郭婉茹 王渌汀 韩雪婷 郭宇光 杜宸洋 参编:仇善召 余志浩 杨卓谦 樊子康 李牧锴 刘卓然 袁琪 关捷雄 华昱云 陈妙然 许鸿智 贺祺
定价:59.80元
印次:1-3
ISBN:9787302603108
出版日期:2022.09.01
印刷日期:2023.10.23
本书将基础理论和实际案例相结合,循序渐进地介绍大数据与人工智能方面的知识,全面、系统地介绍大数据与人工智能的算法概念和适用范畴,并通过11个具体案例分别阐述人工智能和大数据技术在生产生活中的应用。全书共20章,第1~9章分别介绍大数据与人工智能的发展历史、数据工程、机器学习算法、深度学习与神经网络、大数据存储技术、Hadoop MapReduce解析、Spark解析、分布式数据挖掘算法和PyTorch解析等知识,第10~20章为大数据技术和机器学习技术相结合的一些案例。 本书主要面向广大数据工程与人工智能的初学者、高等院校的师生,以及相关领域的从业人员。
more >前言 随着近年来数据科学的发展,人们记录信息的方式和量级不断地发生改变,数据的数量逐渐增多,种类逐渐复杂化,大数据技术得到了广泛的应用。 同时,在大数据时代,人工智能相关技术也得到了越来越多的关注,市场对于人工智能产品的呼声也越来越高。人工智能作为大数据应用的重要出口,在与大数据应用结合的过程中将会得到更广泛的应用。 本书将大数据与人工智能基础理论和实际案例相结合,适合初学者学习。读者可以在短时间内学习本书介绍的知识和概念。作为一本关于大数据与人工智能的书籍,本书共有20章。其中,第1~9章为概念和一些理论知识的介绍,第10~20章为11个实际项目案例。各章的内容如下。 第1章主要阐述大数据与人工智能的概念和发展,并对大数据与人工智能的结合趋势进行预测。 第2章阐述数据工程的一般流程,其中包括数据获取、数据存储和数据预处理技术的详细内容。 第3章主要介绍机器学习的常用算法及其实现细节。算法包括线性回归、逻辑回归、线性判别分析、分类与回归树分析、朴素贝叶斯、k最近邻算法、学习矢量量化、支持向量机、Bagging、随机森林、Boosting和AdaBoost。 第4章主要介绍深度学习的相关知识,即神经网络的基础知识和算法理论。首先介绍神经网络的基础知识; 其次讲解神经网络的训练过程,包括神经网络的参数、向量化、价值函数、梯度下降和反向传播; 然后讲解神经网络的优化和改进方式,卷积神经网络的结构; 最后讲解深度学习的优势及其框架。 第5章介绍大数据存储技术。首先介绍大数据存储技术的发展; 其次介绍海量数据存储的关键技术,包括数据分片与路由,数据复制与一致性; 再次介绍重要数据结构和算法; 然后介绍分布式文件系统和分布式数据库NoSQL; 最后讲解HBase数据库的搭建与使用。 第6章主要是对Hadoop MapReduce的解析。首先介绍Hadoop MapReduce架构; 其次介绍MapReduce的工作机制,包括Map、Reduce、Combine、Shuffle、Speculative Task和任务容错; 最后通过三个应用案例介绍MapReduce分布式计算框架在实际中的应用方式。 第7章是对Spark分布式计算框架的解析。首先介绍Spark RDD; 其次对比了Spark和MapReduce; 再次介绍Spark的工作机制,包括DAG、Partition、Lineage容错方法、内存管理和数据持久化; 然后讲解Spark读取数据的方式; 最后通过两个应用案例对Spark在实际中的应用进行解析。 第8章介绍分布式数据挖掘算法。首先介绍KMeans聚类算法,并对其并行化思路和分布式实现展开讲解; 其次从并行化思路和分布式实现两方面介绍逻辑回归算法; 最后讲解朴素贝叶斯分类算法的设计思路和实现方案。 第9章主要介绍PyTorch深度学习框架。首先介绍PyTorch的基础知识; 其次阐述Tensor相关的PyTorch深度学习基本操作; 最后通过在Spark上运行PyTorch模型和利用PyTorch手写数字识别的应用案例讲解PyTorch框架的使用方法。 第10~20章为11个实际应用中的实战案例。其中,第10~13章为大数据技术的实战案例; 第14~17章为深度学习的案例; 第18~20章包含三个大数据技术和机器学习、深度学习相结合的案例。 本书的主要特点如下。 (1) 结构清晰,理论阐述简洁明了,可读性强。 (2) 以案例为导向,对基础知识和算法理论点在实际中的应用进行详细讲解。 (3) 实战案例丰富,涵盖9个章节的小案例和11个完整项目案例。 (4) 11个完整项目案例都有视频讲解。 (5) 代码详尽,避免对 API 的形式展示,规避重复代码。 (6) 各个数据库相对独立,数学原理相对容易理解。 为便于教学,本书配有源代码。获取源代码和数据集方式: 先扫描本书封底的文泉云盘防盗码,再扫描下方二维码,即可获取。 本书的作者为吕云翔、钟巧灵、郭婉茹、王渌汀、韩雪婷、郭宇光、杜宸洋、仇善召、余志浩、杨卓谦、樊子康、李牧锴、刘卓然、袁琪、关捷雄、华昱云、陈妙然、许鸿智、贺祺,曾洪立参与了部分内容的编写及资料整理工作。 在本书的编写中参考了诸多相关资料,在此向资料的作者表示衷心的感谢。 限于作者水平和时间仓促,书中难免存在疏漏之处,欢迎读者批评指正。 作者2022年6月 思 维 导 图
more >