首页 > 图书中心 >图书详情
大数据导论(第2版)
作者:张凯 张雯婷
丛书名:大数据与人工智能技术丛书
定价:69元
印次:2-1
ISBN:9787302681823
出版日期:2025.02.01
印刷日期:2025.01.21
本书对数据科学与大数据技术本科专业课程和相应知识点进行了介绍。主要内容包括: 数据科学与大数据技术本科专业学习要求,学科概述,大数据硬件环境,数据通信与计算机网络,程序、软件与系统,数据采集与存储,数据统计与分析,图形图像处理与可视化,人工智能,数据安全,大数据平台框架及工具,新技术及其对大数据的影响。本书编写的目的是让学生了解数据科学与大数据技术的学科体系,课程结构,为后续的学习做好准备。
more >第2版前言 2020年本书第1版问世,因近年来大数据技术发展比较快,而各高校均对教材的时效性提出了要求,所以决定出版本书第2版。 这次改版的原则是保持基本结构,补充新内容,删改过时内容,适度调整局部结构。全书的改版工作由张雯婷博士独立完成,原书作者张凯负责本次改版的审核和统稿工作。 第2版删改的内容主要涉及以下章节。 (1) 第2章学科概述的删改包括: 2.2.2节数据科学发展中增加了近年的发展趋势,2.3节全球大数据发展战略中补充了一些近年的新内容。 (2) 第5章程序、软件与系统中增加了5.1.4节Python语言。 (3) 第6章数据采集与存储中将6.1节数据采集与信号调理分解为6.1节数据采集和6.2节数据处理。6.1节数据采集包括6.1.1节各种类型数据的采集、6.1.2节自动识别技术和6.1.3节数据采集系统。6.2节数据处理包括6.2.1节数据处理技术、6.2.2节数据传送和6.2.3节数据清洗与ETL技术。原6.2节数据结构与离散数学和6.3节数据库与数据仓库顺延变为6.3节数据结构与离散数学和6.4节数据库与数据仓库。6.4节数据库与数据仓库中增加了6.4.4节数据中心及其智能化。 (4) 第11章大数据平台框架及工具的11.2节大数据框架与工具中增加了11.2.6节大数据框架Flink技术。 (5) 本书第2版增加了第12章新技术及其对大数据的影响。下设12.1节大数据新技术和12.2节其他新技术及其影响。12.1节大数据新技术中包括12.1.1节云计算与区块链、12.1.2节计算资源与算力、12.1.3节大数据的质量和12.1.4节数据要素与数据知识产权。12.2节其他新技术及其影响中包括12.2.1节存储虚拟化与池化、12.2.2节信息物理系统CPS与数字孪生、12.2.3节ChatGPT与Sora和12.2.4节量子计算机与大数据。 (6) 本书第2版增加了附录A和附录B,分别为模拟试卷和模拟试卷部分参考答案。 再次请读者对本书第2版提出宝贵意见。 本书的教学资料(包括课件、教学计划,教学大纲,电子教案、考试题等)可以从清华大学出版社网站下载。 编者2024年10月28日 第1版前言 “大数据导论”是数据科学与大数据技术专业本科生的一门专业课程,也是该专业的导入课程,以引导学生对数据科学与大数据技术专业和学科有一个全面和概括性的了解。目前,国内外开设“大数据导论”或“数据科学导论”课程的学校和已经出版的相关教材相对较少,例如哈佛大学、纽约大学和中国人民大学教授的课程或出版的教材,其主要是针对研究生开设的,即使是针对本科生开设的专业选修课,也因为讲授的内容较深,或偏重某一方面而不够全面,不太适合我国数据科学与大数据技术专业的本科生。 本书构思有3个想法: 第一,数据科学与大数据技术专业在“教育部专业目录”中属于计算机大类,因此,该导论课程不仅应介绍与数据科学与大数据技术相关的内容,也应介绍一些与计算机科学与技术相关的内容; 第二,既然是导论课程,那就不能讲授得太深,因为学生刚刚从高中进入大学,专业基础薄弱,因此,只需对该专业相关课程的主要内容进行简单介绍即可,也可适度介绍数据科学研究现状、大数据产业的未来及其在各领域的应用; 第三,该专业的名称为数据科学与大数据技术,这就意味着该学科包括“数据科学”和“大数据技术”两方面的内容,不同学校在培养目标上可以有所区别和侧重,例如有的大学授予理学学位,有的大学授予工学学位,其学生的未来会分别往数据科学家和数据工程师方向发展,对于这两方面的内容,本书都力求顾及,不同学校的老师在上课讲授时,可根据自己的情况略有偏重。 全书共11章,内容分别为: 第1章专业学习要求,将介绍学科概述、专业、归类课程体系、学习方法和专业能力要求。 第2章学科概述,将介绍大数据技术、数据科学、全球大数据发展战略、我国大数据发展战略、大数据产业与应用。 第3章大数据硬件环境,将介绍计算机系统组成、硬件计算设备和检测系统。 第4章数据通信与计算机网络,将介绍数据通信、计算机网络和未来发展。 第5章程序、软件与系统,将介绍程序语言与软件、操作系统、软件工程、知识工程与数据工程。 第6章数据采集与存储,将介绍数据采集与信号调理、数据结构与离散数学、数据库与数据仓库。 第7章数据统计与分析,将介绍概率、统计、数值分析、算法分析及数据挖掘与软件工具。 第8章图形图像处理与可视化,将介绍图形、图像、可视化、计算机辅助设计、计算机视觉艺术、多媒体技术、虚拟现实及计算机仿真和医学成像。 第9章人工智能,将介绍人工智能概述、机器学习、决策支持系统、专家系统、深度学习、推荐系统和人工智能应用及其未来。 第10章数据安全,将介绍密码体制、认证技术、信息安全防范、数据安全和系统安全。 第11章大数据平台框架及工具,将介绍大数据平台、大数据框架与工具。 全书由张凯教授编写,博士生张雯婷和肖坤对全书文字进行了校对,相关学科的老师针对本书内容提出了一些宝贵意见。在此,对所有关心本书的学者、同仁、学生表示感谢。 本书在编写过程中参考和引用了大量国内外的著作、论文和研究报告中的结论性内容,由于篇幅有限,本书仅仅列举了主要文献。作者向所有被参考和引用论著的作者表示由衷的感谢。更详细的参考文献请见清华大学出版社网站。 由于水平有限,书中难免存在不足之处,恳请读者提出宝贵意见。 本书提供教学大纲、教学课件、模拟试卷、教学进度表,扫描封底的课件二维码可以下载。 编者2019年5月
more >