首页 > 图书中心 > 大数据技术(微课版)

前言

一、 系列教材背景

人类已经进入智能时代,云计算、大数据、物联网、人工智能、机器人、量子计算等是这个时代最重要的技术热点。为了适应和满足时代发展对人才培养的需要,2017年2月以来,教育部积极推进新工科建设,先后形成了“复旦共识”“天大行动”和“北京指南”,并发布了《教育部高等教育司关于开展新工科研究与实践的通知》《教育部办公厅关于推荐新工科研究与实践项目的通知》,全力探索形成领跑全球工程教育的中国模式、中国经验,助力高等教育强国建设。新工科有两个内涵: 一是新的工科专业;二是传统工科专业的新需求。新工科建设将促进一批新专业的发展,这批新专业有的是依托于现有计算机类专业派生、扩展而成的,有的是多个专业有机整合而成的。由计算机类专业派生、扩展形成的新工科专业有计算机科学与技术、软件工程、网络工程、物联网工程、信息管理与信息系统、数据科学与大数据技术等。由计算机类学科交叉融合形成的新工科专业有网络空间安全、人工智能、机器人工程、数字媒体技术、智能科学与技术等。

在新工科建设的“九个一批”中,明确提出“建设一批体现产业和技术最新发展的新课程”“建设一批产业急需的新兴工科专业”。新课程和新专业的持续建设,都需要以适应新工科教育的教材作为支撑。由于各个专业之间的课程相互交叉,但是又不能相互包含,所以在选题方向上,既考虑由计算机类专业派生、扩展形成的新工科专业的选题,又考虑由计算机类专业交叉融合形成的新工科专业的选题,特别是网络空间安全专业、智能科学与技术专业的选题。基于此,清华大学出版社计划出版“面向新工科专业建设计算机系列教材”。

二、 教材定位

教材使用对象为“211工程”高校或同等水平及以上高校计算机类专业及相关专业学生。三、 教材编写原则

(1) 借鉴Computer Science Curricula 2013(以下简称CS2013)。CS2013的核心知识领域包括算法与复杂度、体系结构与组织、计算科学、离散结构、图形学与可视化、人机交互、信息保障与安全、信息管理、智能系统、网络与通信、操作系统、基于平台的开发、并行与分布式计算、程序设计语言、软件开发基础、软件工程、系统基础、社会问题与专业实践等内容。

(2) 处理好理论与技能培养的关系,注重理论与实践相结合,加强对学生思维方式的训练和计算思维的培养。计算机专业学生能力的培养特别强调理论学习、计算思维培养和实践训练。本系列教材以“重视理论,加强计算思维培养,突出案例和实践应用”为主要目标。

(3) 为便于教学,在纸质教材的基础上,融合多种形式的教学辅助材料。每本教材可以有主教材、教师用书、习题解答、实验指导等。特别是在数字资源建设方面,可以结合当前出版融合的趋势,做好立体化教材建设,可考虑加上微课、微视频、二维码、MOOC等扩展资源。

大数据技术(微课版)出版说明四、 教材特点1. 满足新工科专业建设的需要系列教材涵盖计算机科学与技术、软件工程、物联网工程、数据科学与大数据技术、网络空间安全、人工智能等专业的课程。

2. 案例体现传统工科专业的新需求

编写时,以案例驱动,任务引导,特别是有一些新应用场景的案例。

3. 循序渐进,内容全面

讲解基础知识和实用案例时,由简单到复杂,循序渐进,系统讲解。

4. 资源丰富,立体化建设

除了教学课件外,还可以提供教学大纲、教学计划、微视频等扩展资源,以方便教学。

五、 优先出版1. 精品课程配套教材主要包括国家级或省级的精品课程和精品资源共享课的配套教材。

2. 传统优秀改版教材

对于已经出版过的优秀教材,经过市场认可,由于新技术的发展,给图书配上新的教学形式、教学资源,计划改版的教材。

3. 前沿技术与热点教材

反映计算机前沿和当前热点的相关教材,例如云计算、大数据、人工智能、物联网、网络空间安全等方面的教材。

六、 联系方式

联系人: 白立军

联系电话: 01083470179

联系和投稿邮箱: bailj@tup.tsinghua.edu.cn

“面向新工科专业建设计算机系列教材”编委会

2019年6月

主任:

张尧学清华大学计算机科学与技术系教授中国工程院院士/教育部高等学校软件工程专业教学指导委员会主任委员

副主任:

陈刚浙江大学计算机科学与技术学院院长/教授

卢先和清华大学出版社常务副总编辑、

副社长/编审

委员: 

毕胜大连海事大学信息科学技术学院院长/教授

蔡伯根北京交通大学计算机与信息技术学院院长/教授

陈兵南京航空航天大学计算机科学与技术学院院长/教授

成秀珍山东大学计算机科学与技术学院院长/教授

丁志军同济大学计算机科学与技术系系主任/教授

董军宇中国海洋大学信息科学与工程学院副院长/教授

冯丹华中科技大学计算机学院院长/教授

冯立功战略支援部队信息工程大学网络空间安全学院院长/教授

高英华南理工大学计算机科学与工程学院副院长/教授

桂小林西安交通大学计算机科学与技术学院教授

郭卫斌华东理工大学计算机科学与工程系系主任/教授

郭文忠福州大学数学与计算机科学学院院长/教授

郭毅可上海大学计算机工程与科学学院院长/教授

过敏意上海交通大学计算机科学与工程系教授

胡瑞敏西安电子科技大学网络与信息安全学院院长/教授

黄河燕北京理工大学计算机学院院长/教授

雷蕴奇厦门大学计算机科学系教授

李凡长苏州大学计算机科学与技术学院院长/教授

李克秋天津大学计算机科学与技术学院院长/教授

李肯立湖南大学信息科学与工程学院院长/教授

李向阳中国科学技术大学计算机科学与技术学院执行院长/教授

梁荣华浙江工业大学计算机科学与技术学院执行院长/教授

刘延飞火箭军工程大学基础部副主任/教授

陆建峰南京理工大学计算机科学与工程学院副院长/教授

罗军舟东南大学计算机科学与工程学院教授

吕建成四川大学计算机学院(软件学院)院长/教授

吕卫锋北京航空航天大学计算机学院院长/教授

马志新兰州大学信息科学与工程学院副院长/教授

毛晓光国防科技大学计算机学院副院长/教授

明仲深圳大学计算机与软件学院院长/教授

彭进业西北大学信息科学与技术学院院长/教授

钱德沛中山大学数据科学与计算机学院院长/教授

申恒涛电子科技大学计算机科学与工程学院院长/教授

苏森北京邮电大学计算机学院执行院长/教授

汪萌合肥工业大学计算机与信息学院院长/教授

王长波华东师范大学计算机科学与软件工程学院常务副院长/教授

王劲松天津理工大学计算机科学与工程学院院长/教授

王良民江苏大学计算机科学与通信工程学院院长/教授

王泉西安电子科技大学副校长/教授

王晓阳复旦大学计算机科学技术学院院长/教授

王义东北大学计算机科学与工程学院院长/教授

魏晓辉吉林大学计算机科学与技术学院院长/教授

文继荣中国人民大学信息学院院长/教授

翁健暨南大学副校长/教授

吴卿杭州电子科技大学副校长/教授

武永卫清华大学计算机科学与技术系副主任/教授

肖国强西南大学计算机与信息科学学院院长/教授

熊盛武武汉理工大学计算机科学与技术学院院长/教授

徐伟陆军工程大学指挥控制工程学院院长/副教授

杨鉴云南大学信息学院院长/教授

杨燕西南交通大学信息科学与技术学院副院长/教授

杨震北京工业大学信息学部副主任/教授

姚力北京师范大学人工智能学院执行院长/教授

叶保留河海大学计算机与信息学院院长/教授

印桂生哈尔滨工程大学计算机科学与技术学院院长/教授

袁晓洁南开大学计算机学院院长/教授

张春元国防科技大学教务处处长/教授

张强大连理工大学计算机科学与技术学院院长/教授

张清华重庆邮电大学计算机科学与技术学院执行院长/教授

张艳宁西北工业大学校长助理/教授

赵建平长春理工大学计算机科学技术学院院长/教授

郑新奇 中国地质大学(北京)信息工程学院院长/教授

仲红安徽大学计算机科学与技术学院院长/教授

周勇中国矿业大学计算机科学与技术学院院长/教授

周志华南京大学计算机科学与技术系系主任/教授

邹北骥中南大学计算机学院教授

秘书长:

白立军清华大学出版社副编审大数据技术(微课版)

数据已成为国家基础性战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响。大数据技术涉及的知识点非常多,一本书无法覆盖所有的知识点。本书从各专业对大数据技术需求的实际情况出发,从大数据技术涉及的基本知识开始,层层推进大数据相关技术的讲解,让初学者能够轻松理解并快速掌握。本教材对每个知识点都进行了深入分析,并针对每个知识点精心设计了相关案例。

全书分为12章。

第1章 大数据概述。主要介绍大数据的基本概念、大数据技术和大数据计算模式与典型系统。

第2章 大数据软件基础。主要介绍Linux基础、Java语言基础、SQL基础和在VirtualBox上安装虚拟机。

第3章 Hadoop大数据处理架构。主要介绍Hadoop概述、Hadoop生态系统和Hadoop的安装与使用。

第4章 Hadoop分布式文件系统。主要介绍分布式文件系统的结构、HDFS的基本特征、HDFS存储架构及组件功能、HDFS文件读写流程、HDFS的Shell操作和HDFS编程实践。

第5章 MapReduce分布式计算框架。主要介绍MapReduce概述、MapReduce的工作原理、MapReduce编程类和MapReduce经典案例。 

第6章 HBase分布式数据库。主要介绍HBase概述、HBase系统架构和访问接口、HBase数据表、HBase安装、HBase配置、HBase常用Shell命令、常用的Java API和HBase编程。

第7章 NoSQL数据库。主要介绍NoSQL数据库概述、“键值”数据库、列族数据库、文档数据库和图数据库。

第8章 Scala基础编程。主要介绍Scala特性,Scala安装,Scala数据类型,Scala常量和变量,Scala数组、列表、集合和映射,Scala控制结构,Scala函数,Scala类和Scala读写文件。

第9章 Python基础编程。主要介绍Python安装、Python代码编写方式、Python对象和引用、Python基本数据类型、Python中的数据输入和输出、Python中文件的基本操作、选择结构、循环结构、函数和类。第10章 Spark分布式内存计算。主要介绍Spark概述、Spark的安装及配置、使用Spark Shell编写Scala代码、Spark核心数据结构RDD、Spark运行机制、使用Scala语言编写Spark应用程序和使用Python语言编写Spark应用程序。

第11章 Spark SQL编程。主要介绍Spark SQL概述、Spark SQL与Shell交互、DataFrame对象的创建和DataFrame对象上的常用操作。

第12章 数据可视化。主要介绍Tableau绘图、ECharts绘图和PyeCharts绘图。

崔霄、王博也参加了本书的编写工作。在撰写本书过程中,参考了大量专业书籍和网络资料,在此向这些作者表示感谢。

由于编写时间仓促,编者水平有限,书中难免会有缺点和不足,热切期望得到专家和读者的批评指正,在此表示感谢。您如果遇到任何问题,或有更多的宝贵意见,欢迎发送邮件至作者的邮箱42675492@qq.com,期待能够收到您的真挚反馈。

编者2020年2月于郑州轻工业大学

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘