大数据分析技术与应用实践
提供课件、参考答案、程序、源码,咨询QQ:2301891038(仅限教师)。本书从理论、技术到实践实现对大数据知识领域全方位的覆盖,让读者阅读后能够构建出完成的大数据技术知识体系,并理解各种现存平台和工具的实现机理与内涵,实现从技术到实践的全方位理解与体验。

作者:王宇新 齐恒 杨鑫

丛书名:面向新工科专业建设计算机系列教材

定价:39.8元

印次:1-5

ISBN:9787302547211

出版日期:2020.06.01

印刷日期:2024.06.21

图书责编:杨帆

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书首先从大数据技术概述出发,给出大数据领域的技术概貌及相关应用场景,从而使读者对大数据概念有清晰的认识;其次,本书采取topdown模式,先从计算广告这一具有代表性的应用实践着手,阐明大数据技术是如何应用并发挥效用的;再次,依次介绍大数据采集与处理、大数据存储与查询、大数据计算与分析等关键技术;最后,将关键技术引申到两类重要的大数据应用技术: 一类是Spark和机器学习应用,另一类是数据可视化应用。以此构建了一个大数据分析技术的基本闭环。除了内容的闭环体系之外,本书的另一大特色是将项目实践拆解融入各项关键技术中,从而实现理论与实践的有机融合,满足“新工科”建设的首要需求。 本书可作为高等院校计算机类专业的大数据分析、应用方面的理论或实践课程的教材,也可供自学者及从事计算机应用、大数据开发等的工程技术人员参考。

王宇新,博士,大连理工大学计算机科学与技术学院副教授,主管教学副院长。承担多项***和省部级教育教学改革项目,主要目标是加强大数据、人工智能等新兴技术在传统计算机专业中的教学质量。

一、 系列教材背景 人类已经进入智能时代,云计算、大数据、物联网、人工智能、机器人、量子计算等是这个时代最重要的技术热点。为了适应和满足时代发展对人才培养的需要,2017年2月以来,教育部积极推进新工科建设,先后形成了“复旦共识”“天大行动”“北京指南”,并发布了《教育部高等教育司关于开展新工科研究与实践的通知》《教育部办公厅关于推荐新工科研究与实践项目的通知》,全力探索形成领跑全球工程教育的中国模式、中国经验,助力高等教育强国建设。新工科有两个内涵: 一是新的工科专业;二是传统工科专业的新需求。新工科建设将促进一批新专业的发展,这批新专业有的是依托于现有计算机类专业派生、扩展而成的,有的是多个专业有机整合而成的。由计算机类专业派生、扩展形成的新工科专业有计算机科学与技术、软件工程、网络工程、物联网工程、信息管理与信息系统、数据科学与大数据技术等。由计算机类学科交叉融合形成的新工科专业有网络空间安全、人工智能、机器人工程、数字媒体技术、智能科学与技术等。 在新工科建设的“九个一批”中,明确提出“建设一批体现产业和技术最新发展的新课程”“建设一批产业急需的新兴工科专业”。新课程和新专业的持续建设,都需要以适应新工科教育的教材作为支撑。由于各个专业之间的课程相互交叉,但是又不能相互包含,所以在选题方向上,既考虑由计算机类专业派生、扩展形成的新工科专业的选题,又考虑由计算机类专业交叉融合形成的新工科专业的选题,特别是网络空间安全专业、智能科学与技术专业的选题。基于此,清华大学出版社计划出版“面向新工科专业建设计算机系列教材”。 二、 教材定位 教材使用对象为“211工程”...

目录
荐语
查看详情 查看详情

第1章大数据技术概述1

1.1大数据产品诞生1

1.2什么是大数据2

1.3大数据解决的问题场景4

1.4大数据与Google5

习题17

第2章计算广告介绍与课程应用实践8

2.1计算广告8

2.1.1互联网广告介绍8

2.1.2互联网广告效果评估9

2.1.3如何计算10

2.1.4计算广告系统11

2.2应用实践12

2.2.1应用实践数据12

2.2.2CTR预测13

2.2.3项目实践1: 了解应用实践数据14

2.2.4项目实践2: 实践环境搭建14

习题215

第3章大数据采集与处理16

3.1网络爬虫16

3.1.1网络爬虫介绍16

3.1.2构建一个网络爬虫的实践经验17

3.1.3HTTP介绍18

3.1.4网页解析与CSS选择器20

3.1.5项目实践3: 抓取网页并提取标题和正文21

3.2Apache Kafka253.2.1系统架构25

3.2.2消息、主题和Schema26

3.2.3分区26

3.2.4生产者与消费者27

3.2.5代理31

3.2.6Kafka关键特性32

3.2.7项目实践4: 通过Kafka进行数据处理34

3.2.8构建一个真实数据通道需要考虑的问题37

3.3ETL、Apache Flume和其他框架39

3.3.1ETL39

3.3.2Apache Flume41

3.3.3其他大数据采集处理框架42

习题345

〖3〗大数据分析技术与应用实践目录〖3〗第4章大数据存储与查询46

4.1HDFS46

4.1.1从设计一个分布式系统开始4... 查看详情

u    在数据时代,任何IT公司本质上都是数据公司,最核心的技能就是大数据技术,本书将带领你了解什么是大数据技术。

u    本书带领读者在Hadoop、MapReduce、Hive、Hbase、Spark这些耳熟能详的大数据名词中一探究竟,理解大数据分析与应用开发的核心理念。

u    本书以大数据中最炙手可热的互联网广告为实践应用,让大家充分领略到大数据技术的独特魅力。

u    本书有配套的教学课件、源代码、课程计划和教学大纲等资源,方便教学。 查看详情