首页 > 图书中心 >图书详情

数据挖掘:方法与应用(第2版)

了解数据挖掘的基本概念,掌握数据分析技术,开展数据挖掘相关领域的工作和学习研究。课件下载处为本书配套资源。

作者:徐华
定价:45
印次:2-3
ISBN:9787302601449
出版日期:2022.04.01
印刷日期:2023.08.01

本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系编写而成。本书系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。 本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。

more >

第2版前言 “数据挖掘: 方法与应用”课程是清华大学计算机系面向清华大学全校非信息类工科专业学生所开设的公选课程。自从2011年春季学期开设课程以来,课程内容、教学体系和作业考核方式等方面的教学改革工作一直在进行探索。课程教学团队陆续完成了如下几大方面的教学改革探索。 首先,教学团队根据早期的教学体例,在2014年编著出版了课程的配套教材——《数据挖掘: 方法与应用》。 其次,教学团队根据课程教学案例的展示情况,在2017年精选了一批有代表性的跨专业背景的优秀课程作业案例并结集出版教学参考书——《数据挖掘: 方法与应用——应用案例》。至此,课程系列化的教材初步形成。2020年上述系列化教材获得“清华大学优秀教材二等奖”。 第三,在课件体例的编排和内容扩展方面,第1版教学课件于2014年初步成型,其中,中文版课件通过配套图书向外界共享。从2019年开始利用连续三年的教学实践,逐步扩充了最新的教学内容,并形成新版的教学课件,特别扩充了数据挖掘中的数据获取、深度学习和数据可视化等方面的专题性内容,使整体教学课件内容的体系更加丰富和完善。 第四,在课程作业环节的探索方面,课程从2019年开始探索将工业界的实际数据挖掘任务以高难度挑战作业的形式引入到课程的教学环节,让课堂上学有余力的学生进一步提升分析问题和解决问题的能力。该项教学改革方面的探索也获得“清华大学教育教学改革项目”的支持。 第五,在课程教学内容的改革创新上,特别是课程的高级专题讲授环节,多次邀请了工业界在行业数据挖掘领域卓有建树的企业CTO进行行业数据挖掘案例的分享,以扩展同学们在数据挖掘领域的视野,加深对于面对问题分析的洞察力,效果显著。 随着时代和行业应用的发展,对于“数据挖掘”课程提出了更多、更新、更高的教学要求。为了应对这样的变化,《数据挖掘: 方法与应用》(第2版)在原书的基础上进行了如下内容的扩展。 首先,新补充了“数据获取”章节。由于传统的数据挖掘工作都是假设数据已经准备好的前提下而开展的,但在实际应用研发工作中,数据获取仍然是一个工程技术上面临的重大挑战。为了克服由于数据不足而带来的问题,本书结合数据挖掘领域近几年研发的进展情况,概述了数据获取的主要方法和相关的技术手段,以作为未来深入开展数据获取的引导性内容。 其次,新补充了“深度学习”章节。近年来,以深度学习为代表的数据驱动类型的机器学习方法得到了各方面的广泛应用。相比于传统的机器学习方法,深度学习方法能够学习出有效的分类特征,并获得更高的分类精度。基于此,本书第2版中补充了“深度学习”一章,作为学习“深度学习”方法的综述性引导。 第三,新补充了“数据可视化”章节。数据挖掘的目的是为了发现数据中隐藏的有价值的知识,而以往发现的知识常常表现为一种抽象形式,决策者很难有直观的理解。为此,数据挖掘领域常常会采用数据可视化的方法来直观地呈现数据挖掘与分析的结果。基于此,本书第2版中补充“数据可视化”一章内容,以此起到学习“数据可视化”方法与技术的引领目的。 在上述内容扩展的基础上,形成了今天《数据挖掘: 方法与应用》(第2版)呈现在各位读者面前,希望能对新发展和新应用背景下开展“数据挖掘”教学和相关实践工作起到导引的作用。 另外,本书第1版、第2版和配套案例教材的相关共享资料(课件、代码、数据集等)将在开源共享社区github和清华大学出版社官网www.tup.com.cn同步发布,并即时更新。欢迎各位读者留言与反馈,或发邮件至bailj@tup.tsinghua.edu.cn。 本书第2版成稿之际,感谢2020年春季、2021年春季课程助教余文梦、吴至婧同学为本书内容整理付出的巨大努力;感谢赵少杰、陈小飞同学为相关材料收集、文献调研和书稿排版做出的贡献。 作者2021年7月6日第1版前言 近年来,随着计算机硬件资源成本的持续下降,软件开发技术的不断进步,基于不同领域的大数据(Big Data)研究与应用性研发工作正在如火如荼地开展起来。作为大数据挖掘、分析与处理的关键方法与技术之一,“数据挖掘”正在被不同的专业领域所关注,“数据挖掘”也逐渐演变成一门具有通用性和基础性的数据处理方法与技术。正是在这样的大环境背景之下,作者于2011年春季学期开始开设了面向清华大学非计算机专业学生的专业课程“数据挖掘: 方法与应用”。开设这门课程的主要目的是为了让不同专业领域的学生能够掌握数据挖掘的基本概念、基本方法和基本算法实现技术,能够针对不同专业领域的数据挖掘与分析问题,开展相应的数据挖掘与分析工作。 参照国外相关大学的教材、课件和应用实例,本书内容的编排顺序主体上是按照一个典型的知识发现过程进行编排的,分别是基本概念、数据预处理、数据仓库构建、关联规则挖掘与相关性分析、聚类分析(无监督的学习分类)、分类方法(有监督的学习分类)。在相关方法与算法讲解的基础之上,进一步展示用本书所介绍的数据挖掘与相关知识开展的一个快速消费品领域消费者调查问卷的挖掘与分析实例,以及在此基础上所构建的一个消费者皮肤状况预测模型。 作为面向非计算机专业学生的课程,本书以介绍概念和讲解方法的主要思想为主。对于有进一步深入学习需求的学生,建议进一步研读高级机器学习、高级数据挖掘等知识内容相关的书籍。在课程教学计划安排上,建议理论方法讲解安排32学时,同时安排16学时的课程实践与讨论环节,以进一步增强学生在数据挖掘与分析方面的应用实战能力,提升未来对于本专业领域数据挖掘与分析的能力。 由于作者水平所限,本书在编写过程中纰漏和疏忽之处在所难免,望读者不吝指正。 徐华2014年初春于清华园

more >
扫描二维码
下载APP了解更多

同系列产品more >

数据结构(C语言版)(第3版)

殷人昆
定 价:89元

查看详情
Java语言程序设计实践教程

郑莉、尹刚、张宇
定 价:39元

查看详情
计算机操作系统教程(第5版)

张尧学、任炬、卢军
定 价:59元

查看详情
计算机操作系统教程(第5版)习题...

张尧学、任炬、卢军
定 价:38元

查看详情
图论与代数结构(第2版)

崔勇,张小平
定 价:49元

查看详情
图书分类全部图书
more >
  • 徐华,清华大学计算机系副教授,博士生导师。长期担任数据挖掘、网络产品设计等相关本科研究生课程的教学工作。主要从事智能机器人相关的智能优化调度、智能交互方面的研究工作。目前发表国际期刊论文40篇,领域**国际会议论文70篇,获得国家科技进步二等奖一次,省部级政府科技奖励4次,行业协会科技发明一等奖2次。
  • 了解数据挖掘的基本概念,掌握数据分析技术,开展数据挖掘相关领域的工作和学习研究。
more >
  • 目录

    第1章绪论1

    1.1应用背景1

    1.1.1商业上的驱动2

    1.1.2科学研究上的驱动2

    1.1.3数据挖掘伴随着数据库数据库技术而出现2

    1.2什么是数据挖掘3

    1.2.1基本描述3

    1.2.2知识发现知识发现4

    1.3数据挖掘的主要技术5

    1.4数据挖掘的主要研究内容7

    1.5数据挖掘面临的主要问题10

    1.6数据挖掘相关的资料11

    1.7本书的总体章节安排12

    1.8小结13

    参考文献13

    第2章数据获取15

    2.1引言15

    2.2背景介绍15

    2.3数据采集17

    2.3.1数据发现17

    2.3.2数据增强18

    2.3.3数据生成18

    2.4数据标注19

    2.4.1利用现有标签19

    2.4.2基于众包技术19

    2.4.3使用弱监督学习的方法20

    2.5提升已有数据和模型20

    2.5.1提升已有数据20

    2.5.2提升已有模型21

    2.6技术选择指南21

    2.7小结21

    参考文献21

    第3章数据预处理23

    3.1引言23

    3.2数据预处理的基本概念23

    3.2.1数据的基本概念23

    3.2.2为什么要进行数据预处理26

    3.2.3数据预处理的任务27

    3.3数据的描述27

    3.3.1描述数据的中心趋势28

    3.3.2描述数据的分散程度30

    3.3.3描述数据的其他方式31

    3.4数据清洗33

    3.4.1数据缺失的处理33

    3.4.2数据清洗34

    3.5数据集成和转换36

    3.5.1数据集成36

    3.5.2数据冗余36

    3.5.3数据转换38

    3.6数据归约和变换3...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘