首页 > 图书中心 >图书详情
数据仓库与数据挖掘(第二版)
作者:陈志泊、韩慧、王建新、孙俏、聂耿青
丛书名:21世纪高等学校计算机类专业核心课程系列教材
定价:49元
印次:2-12
ISBN:9787302483991
出版日期:2017.11.01
印刷日期:2024.12.10
本书主要介绍数据仓库和数据挖掘技术的基本原理和应用方法。全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。 本书既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,书中都使用Microsoft SQL Server 2005进行了操作实现。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。 本书每章均配有习题,习题形式为选择题、简答题和操作题,可以帮助读者进一步掌握和巩固所学知识。此外,本书提供多媒体教学课件和习题参考答案,读者可到清华大学出版社网站http://www.tup.com.cn/下载。 本书可以作为高等学校计算机及相关专业本科、研究生的数据仓库和数据挖掘教材,也可供相关领域的广大科技工作人员和高校师生参考。
more >F O R E W O R D 前言 随着计算机和信息时代的迅猛发展,人类收集、存储和访问数据的能力大大增强,快速增长的海量数据集已经远远超出了人类的理解能力,传统的数据分析工具也显得力不从心。如何才能不被这些海量数据淹没,而是有效地组织这些数据,并且从中找出有价值的知识,帮助人类制定正确的决策?针对这一问题,数据仓库和数据挖掘技术应运而生,并且显示出强大的生命力。要将海量数据转换成为有用的信息和知识,首先要有效地收集和组织数据。数据仓库是良好的数据收集和组织工具,它的任务是搜集来自各个业务系统的有用数据,存放在一个集成的储存区内。在数据仓库丰富完整的数据基础上,数据挖掘技术可以从中挖掘出有价值的知识,从而帮助决策者正确决策。 本书主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。其中,前3章主要介绍数据仓库的基本原理和数据仓库系统的组建方法,后面的章节介绍当前流行的数据挖掘算法的主要思想和理论基础,并且给出丰富的应用实例。 本书紧跟数据仓库和数据挖掘技术的发展和人才培养的目标,有以下几个特点。 (1) 可读性强,文字叙述深入浅出,易读易用,即使是初学者,阅读起来也比较容易。 (2) 概念清晰,条理清楚,内容取舍合理。 (3) 本书强调基础,重视实例。各章节都以经典算法为主,介绍其主要思想和基本原理,并且给出恰当和丰富的实例。 (4) 书中实例和课后习题实用、丰富,通过练习,读者可以对各个知识点从不同角度得到训练,掌握和巩固所学知识。 (5) 教学资源丰富,本书提供多媒体教学课件和习题参考答案,方便教学。对于上述资源,读者可到清华大学出版社的网站http://www.tup.com.cn/下载。 (6) 对于数据仓库的组建方法和多数章节中的数据挖掘算法,本书都使用Microsoft SQL Server 2005进行了操作实现,这种做法与市场主流开发工具和技术同步,有利于读者走向社会。 本书各章节之间衔接自然,同时各章节又有一定的独立性,读者可按教材的自然顺序学习,也可以根据实际情况挑选需要的章节学习。 本书可以作为高等学校计算机及相关专业本科、研究生学习数据仓库和数据挖掘的教材,也可供相关领域的广大科技工作人员和高校师生参考。 本书由陈志泊担任主编,第1~3章由聂耿青编写,第5章、第6章和第11章由韩慧编写,第4章和第10章由孙俏编写,第7~9章和第12章由王建新编写。 由于时间仓促,加之编者水平有限,对于书中不足之处敬请读者批评指正。 编者 2017年8月
more >