大数据基础与Python机器学习
一本面向非计算机专业人士、以应用为导向,以案例实践为载体的数据科学与大数据技术导引教材。

作者:高静、申志军、姜新华、陈俊杰

丛书名:大数据系列丛书

定价:69.8元

印次:1-4

ISBN:9787302602392

出版日期:2022.05.01

印刷日期:2025.01.15

图书责编:张玥

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书全面介绍与大数据和人工智能相关的数据采集、数据存储、并行计算等技术体系,以及Python编程基础、数据处理分析和可视化、机器学习算法和深度学习模型的原理与应用。 全书共分4部分:第1部分(第1章)为大数据基础,主要介绍与大数据应用相关的数据采集、数据存储、并行计算等技术体系;第2部分(第2章)为Python编程基础,主要介绍Python的基本语法,为读者学习后续的数据处理分析、可视化、机器学习算法和深度学习模型等内容提供基础知识;第3部分(第3、4章)为数据处理分析和可视化,主要介绍基于Pandas的数据处理分析方法和基于Matplotlib的数据可视化方法;第4部分(第5~9章)为机器学习和深度学习,其中,第5~8章主要介绍回归、聚类、分类等机器学习算法及应用,第9章主要介绍深度学习模型及建模应用。各章都有配套的思考题、自测习题和教学视频等资源。 本书适合作为高等学校数据科学与大数据技术、计算机科学与技术、网络工程、软件工程、物联网工程等专业的大数据导论、Python编程技术、数据处理及可视化、Python数据科学导引以及机器学习等课程的教材,也可作为IT开发人员、非计算机专业师生和科研工作者的参考书。

高静博士,院长、博士生导师,致力于大数据和人工智能在农牧业等领域的应用研究。自治区新世纪“321人才”工程第一层次,“内蒙古自治区农牧业大数据研究与应用重点实验室”主任,“内蒙古自治区数据科学与大数据学会”副会长。主持完成国家自然科学基金、国家科技重大专项等国家、省部级项目7项;出版译著5部,发表论文45篇,获得授权发明专利5项,登记软件著作权10项,科研成果获内蒙古自治区科技进步一等奖和二等奖各1项。

前言 大数据和人工智能已经成为信息技术发展的新动能,围绕大数据和人工智能的创新层出不穷。究其根本,所有新思路和新技术都离不开高质量的数据,因此与数据相关的大数据技术体系,如数据采集、数据存储、并行计算、数据处理分析、编程工具Python、数据处理分析工具Pandas、数据可视化工具Matplotlib,以及与人工智能相关的机器学习算法和深度学习模型等,已成为学习大数据、人工智能的必备知识。基于这种现状,本书将上述知识按照逐层深入的思路进行整合,使之成为一条有机的阶梯式递进学习链,帮助读者从基础知识到应用实践一步步构建大数据和人工智能应用的知识体系。 本书以IT企业对从业人员技术能力要求为出发点,以工程实践能力培养为目标,按照工程需求组织内容,便于读者学习和掌握。本书既可以作为高校计算机类专业各层次的教材,还可以作为IT开发人员、非计算机专业师生和科研工作者的参考书。 本书具有以下特点: (1) 知识覆盖面广,技术体系完整。本书涵盖大数据技术体系、Python编程基础知识、数据处理分析和可视化方法以及机器学习算法和深度学习模型等基础理论和相关应用知识。 (2) 理论和实践相结合。本书运用丰富的实践案例帮助读者理解相关原理和理论,同时用详细的操作步骤和直观的运行结果展示其背后的规则和算法,避免单调的理论叙述,易教易学。 (3) 配套资源丰富。本书提供配套的课件、例题案例、自测习题和各知识点的教学视频,适合线上线下混合式教学。 本书由高静、申志军、姜新华、陈俊杰、谢聪娇、左东石、刘敏、白洁和刘振羽等共同编写。其中,高静和刘振羽共同编写了第1章,白洁编写了第2章,...

课件下载

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1章数据与大数据导论1

1.1大数据概述1

1.1.1大数据的来源1

1.1.2大数据的定义和特征3

1.1.3数据结构类型4

1.1.4数据分析流程5

1.2大数据采集和预处理6

1.2.1大数据采集设备6

1.2.2大数据采集方法7

1.2.3大数据预处理技术7

1.3大数据的存储20

1.3.1数据存储设备20

1.3.2传统大数据存储22

1.3.3数据中心与云存储23

1.3.4大数据存储26

1.3.5数据仓库31

1.4云计算与大数据并行计算32

1.4.1云计算与云计算平台32

1.4.2MapReduce计算模型35

1.4.3Hadoop36

1.4.4Spark37

1.5大数据分析38

1.5.1大数据分析概念38

1.5.2大数据分析方法39

1.5.3机器学习与特征选择42

1.5.4机器学习算法45

1.5.5深度学习算法47

1.6大数据可视化51

1.6.1数据可视化概述51

1.6.2数据可视化技术51

1.6.3数据可视化工具54

1.6.4数据可视化案例56

1.7大数据应用及挑战58

1.7.1大数据应用58

1.7.2大数据带来的挑战60

思考题61第2章Python基础62

2.1Python编程环境62

2.1.1Anaconda概述62

2.1.2Anaconda的安装63

2.1.3Anaconda的包管理63

2.1.4运行Python代码或程序64

2.2变量和内置数据类型66

2.2.1变量和变量赋值66

2.2.2内... 查看详情

本书详细介绍大数据技术体系和Python编程基础知识、数据处理分析、可视化方法和机器学习算法、深度学习模型等理论和应用知识,可作为本科通识教材,也可作为计算机科学和大数据等专业的数据处理及可视化、机器学习教材。 查看详情