数据挖掘:方法与应用
课件处为本书PPT教案

作者:徐华

丛书名:清华大学计算机系列教材

定价:25元

印次:1-9

ISBN:9787302369011

出版日期:2014.10.01

印刷日期:2021.07.26

图书责编:杨帆

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统的介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。 本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。

徐华同志,1998年获得西安交通大学计算机专业学士学位,2003年获得清华大学计算机应用技术专业博士学位。2003-2005年在清华大学自动控制专业从事博士后研究工作。2006年留校工作,2006年晋升为副研究员,现为清华大学计算机科学与技术系教师。 一、在教学方面:作为主讲教师,开设并讲授了全校本科生课程《数据挖掘:方法与应用》(课程号:00740253,48学时);并参与了全校研究生学位课程《计算几何》的部分教学工作。 二、在科研方面:负责主持国家科技重大专项(课题)3项,863项目子课题2项,国家自然科学基金项目1项,国际合作项目9项;作为研发骨干,参与国家自然科学基金项目1项,国家科技支撑计划项目1项,横向合作项目2项。在本领域,Information Science、Neurocomputing等国内外权威期刊上已发表和录用论文10篇,在GECCO、PAKDD、AAAI、COLING等权威国际会议上发表和录用论文25篇,参与编写学术专著2部;国家发明专利授权2项,获得软件著作权6项;正在申请的国际发明专利3项和国内发明专利10项。其中,作为课题负责人和课题首席技术专家,负责组织了多个�系的老师联合完成国家“十一五”02号科技重大专项项目课题的研发工作,(项目名称:“65nm PVD研发”,整机装备测试与故障诊断平台研发(课题编号:2009ZX02001-003),课题经费:1104万元),相关研发工作已受到了科技部专家组、项目牵头单位的认可。所指导的博士研究生(翟忠武)获得2011年度数据挖掘领域权威学术会议PAKDD2011最佳论文奖;所指导的硕士研究生(温赟)获得2011年度清华大学优秀硕士论文奖和2011年度优秀硕士毕业生。 三、获奖励及荣誉方面:徐华同志自2006年留校工作至今,获得国家科技进步二等奖1次,省部级科技一等奖1次,已公示获得省部级科技三等奖1次,院系年度先进工作者1次。分别是2009年度国家科技进步二等奖(集体奖项,第三完成单位,清华大学校内排名第1)、2007年度北京市科技进步一等奖(第三完成单位,第15完成人)、已公示获得2010年度重庆市科技进步三等奖(第二完成单位,第2完成人)、获得“2010年度清华大学计算机系先进工作者”荣誉称号。�

序 “清华大学计算机系列教材”已经出版发行了30余种,包括计算机科学与技术专业的基础数学、专业技术基础和专业等课程的教材,覆盖了计算机科学与技术专业本科生和研究生的主要教学内容。这是一批至今发行数量很大并赢得广大读者赞誉的书籍,是近年来出版的大学计算机专业教材中影响比较大的一批精品。 本系列教材的作者都是我熟悉的教授与同事,他们长期在第一线担任相关课程的教学工作,是一批很受本科生和研究生欢迎的任课教师。编写高质量的计算机专业本科生(和研究生)教材,不仅需要作者具备丰富的教学经验和科研实践,还需要对相关领域科技发展前沿的正确把握和了解。正因为本系列教材的作者们具备了这些条件,才有了这批高质量优秀教材的产生。可以说,教材是他们长期辛勤工作的结晶。本系列教材出版发行以来,从其发行的数量、读者的反映、已经获得的国家级与省部级的奖励,以及在各个高等院校教学中所发挥的作用上,都可以看出本系列教材所产生的社会影响与效益。 计算机学科发展异常迅速,内容更新很快。作为教材,一方面要反映本领域基础性、普遍性的知识,保持内容的相对稳定性;另一方面,又需要紧跟科技的发展,及时地调整和更新内容。本系列教材都能按照自身的需要及时地做到这一点。如王爱英教授等编著的《计算机组成与结构》、戴梅萼教授等编著的《微型计算机技术及应用》都已经出版了第四版,严蔚敏教授的《数据结构》也出版了三版,使教材既保持了稳定性,又达到了先进性的要求。 本系列教材内容丰富,体系结构严谨,概念清晰,易学易懂,符合学生的认知规律,适合教学与自学,深受广大读者的欢迎。系列教材中多数配有丰富的习题集、习题解答、上机及实验指导和电子教...

课件下载

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
第1章绪论1

1.1应用背景1

1.1.1商业上的驱动2

1.1.2科学研究上的驱动2

1.1.3数据挖掘伴随着数据库技术而出现2

1.2什么是数据挖掘3

1.2.1基本描述3

1.2.2关于知识发现4

1.3数据挖掘的主要技术5

1.4数据挖掘的主要研究内容7

1.5数据挖掘面临的主要问题10

1.6数据挖掘相关的资料11

1.7本书的总体章节安排12

1.8小结13

参考文献13

第2章数据预处理14

2.1前言14

2.2数据预处理的基本概念14

2.2.1数据的基本概念14

2.2.2为什么要进行数据预处理17

2.2.3数据预处理的任务18

2.3数据的描述18

2.3.1描述数据的中心趋势19

2.3.2描述数据的分散程度21

2.3.3描述数据的其他方式22

2.4数据清洗24

2.4.1数据缺失的处理24

2.4.2数据清洗25

2.5数据集成和转换27

2.5.1数据集成27

2.5.2数据冗余性27

2.5.3数据转换29

2.6数据归约和变换30

2.6.1数据归约30

2.6.2数据离散化33

2.6.3概念层次生成34

2.7小结35

参考文献36

第3章数据仓库37

3.1前言37

3.2数据库基本概念回顾37

3.2.1数据库简介38

3.2.2表、记录和域38

3.2.3数据库管理系统38

3.3数据仓库简介39

3.3.1数据仓库特点39

3.3.2数据仓库概念40

3.3.3数据仓库作用41

3.3.4数据仓库与DBMS对比41

3.3.5分离数...