图书前言

出 版 说 明

20世纪三四十年代,一直摸索着前进的计算技术与刚走向成熟的电子技术结缘。这一结合,不仅孕育了新一代计算工具——电子计算机,还产生了当时谁也没有料到的巨大效应: 电子计算机——这种当初为计算而开发出来的工具,很快就超出计算的范畴,成为“信息处理机”的代名词;人类开始能够高效率地开发并利用信息;信息对人类社会的作用得以有效地发挥,并逐步超过材料和能源,成为人类社会的重要支柱;信息产业急剧增长,信息经济高度发展,社会生产力达到了新的高度;人们的信息化意识不断加强,人类在信息资源方面更加激烈地竞争,社会发展走上信息化轨道。

    文化是时代的精髓,是特定的人群在一定的历史时期、一定的地域范围对其生产和生活模式、思维和行为方式的觉悟和理性化,它伴随着人类创造和使用工具能力的提高而不断发展。文者,经天纬地也;化者,变化、改变、造化、习俗、风气也。也可以说,文化作为社会的人们在生产和生活中思维和行为方式的理性化,是文治和教化的结果。因此,文化具有区域性、群体性和时代性。在信息时代的帷幕刚刚拉开、新时代的气息开始弥漫社会各个角落的20世纪70年代,先觉们就已开始创办以加速信息化的进程为宗旨、以培养信息资源开发人才为目标的信息管理与信息系统专业。

    从与信息有关的学科纵向来看,信息管理与信息系统专业处于信息学、信息技术、信息管理、信息经济、信息社会学这个层次结构的中间,它下以信息学和信息技术为基础,上与信息经济和信息社会学相联系。从其涉及的学科横向来看,它处在管理学、信息科学与技术和有关专业领域的交叉点上。它对技术有极高的要求,又要求对组织有深刻的理解,对行为有合理的组织,反映了科学与人文融合的特点。这种交叉与融合正是信息管理与信息系统专业最重要的特征,是其他的学科或专业难以取代和涵盖的。

    我国的信息管理与信息系统专业创建于20世纪70年代末。在近20年的时间里,已发展到151个点,成为培养信息化人才的重要领域。其发展速度之快、影响之深远已令世人和学术界刮目相看。然而作为一个新的、特别是与各行各业关系极为密切的专业,其课程体系、教学内容以及教学方法、手段,都要经历一个逐步完善、逐步成熟的过程,其教材体系的建设更需要较长期的实践和探索。没有这样一个过程,具有专业特点、符合中国实际的教材体系是不会建立的。近20年来,大家一直在课程体系的完善和建设有自己专业特点的教材方面不断进行探讨。1991年,全国10所财经类院校的经济信息管理专业的负责人在太原召开第一次研讨会。以后,1993年在大连、1995年在武汉、1997年在烟台,又有更多的院校参加到了这一研讨之中。这些研讨活动得到了国家教委有关部门的赞许和支持。通过研讨,大家在建设具有专业特点的教材体系、改变简单照搬其他专业教材上取得了共识。在武汉会议之后,即着手进行系列教材的编写工作。经协商,由张基温教授担任主编,由魏晴宇教授、陈禹教授担任顾问。

这套教材是我国信息管理与信息系统专业的第一套教材。尽管编写者为它付出了巨大的辛劳,但在实践中我们也深深地感到了时代的鞭策和工作的难度。一方面,席卷全球的信息化大潮已经使信息、信息管理、信息系统成为全社会关注的热点,人们对其期望和要求越来越高;另一方面,在世纪之交的今天,作为现代社会先导技术的信息技术和相关学科的更新速度在不断加快,多种社会因素相互渗透、相互影响,新情况、新问题给专业的建设带来很多的困难。当然,这些对我们专业的发展和建设也是一种动力和机遇。为此,在这套教材问世之际,我们再一次表示一个心愿:希望与全国的同行共勉,在教材和专业建设上齐心协力,做出更大贡献。也由于如上种种原因,这套教材不会是完整的,也不会是完美的,一定存在这样那样的不足或错误,我们将会不断补充,不断修改,不断完善。任何建设性意见都是我们非常期盼的。为此,这一套教材将具有充分的开放性: 每一本教材都是一个原型,每一条建设性意见都将会被采纳,并享有自己的知识产权。

全国高等院校计算机基础教育研究会

财经信息管理专业委员会

信息管理与信息系统专业系列教材编委会

1997年8月

前言

数据仓库(data warehouse,DW)是利用数据资源提供决策支持。它比利用模型资源辅助决策更有效,而且辅助决策的范围更宽。由于在现实中,数据大量存在,而且在迅速地增长,只要将面向应用(事务驱动)的数据库重新组织转变为面向决策分析的数据仓库,就可以帮助决策者从不同的视角,通过综合数据分析掌握现状;通过多维数据分析发现各种存在的问题;通过对数据层次的钻取找出问题产生的原因;通过历史数据预测未来。由于数据仓库辅助决策效果明显,数据仓库已经从20世纪90年代中期兴起,经过几年的发展,迅速形成了潮流。

数据挖掘(data mining,DM)是从数据中挖掘出信息和知识,是从人工智能的机器学习(machine learning,ML)中发展起来的。机器学习是让计算机模拟人的学习方法获取知识。机器学习中的大量学习方法已经引入到数据挖掘中。数据挖掘也是20世纪90年代中期兴起的。正是由于数据挖掘具有获取知识的能力,目前各数据仓库均将数据挖掘作为数据仓库的前端分析工具,用于提高数据仓库的决策支持能力。

数据仓库、数据挖掘和联机分析处理(on line analytical processing,OLAP)结合起来的新决策支持系统是以数据驱动的决策支持系统。而传统决策支持系统(decision support system,DSS)是以模型和知识驱动的决策支持系统,是由模型库系统、知识库系统、数据库系统和人机交互系统组成的。新决策支持系统利用的是数据资源,而传统决策支持系统利用的是模型资源和知识资源,它们两者辅助决策的方式和效果均不相同。新决策支持系统并不能代替传统决策支持系统,它们是相互补充的。新决策支持系统与传统决策支持系统结合起来形成的综合决策支持系统将是决策支持系统发展的新方向。

数据仓库、数据挖掘、联机分析处理等结合起来也称为商业智能(business intelligence,BI)。商业智能是一种新的智能技术,区别于人工智能(artificial intelligence,AI)和计算智能(computational intelligence,CI)。人工智能采用的技术是符号推理,符号推理过程形成了概念的推理链。计算智能采用的技术是计算推理,模拟人和生物的模糊推理、神经网络计算和遗传进化过程。商业智能是从数据仓库和数据挖掘中获取信息和知识,对变化的商业环境提供决策支持。商业智能是目前企业界正在大力推广的知识管理(knowledge management,KM)的基础。

作者于1997年6月30日在《计算机世界》报上发表了一组关于数据开采(数据挖掘)的文章,最早向国内学者介绍了数据挖掘概念和技术。作者又于1998年6月15日在《计算机世界》报上发表了一组关于数据仓库与决策支持系统的文章,在介绍基于数据仓库的决策支持系统上,提出了将基于数据仓库的决策支持系统和传统决策支持系统结合的综合决策支持系统,在国内产生了一定的影响。

本书的特点是从数据仓库和数据挖掘的兴起与演变来说明它们的本质,通过例子来解释它们的原理,既系统地介绍了数据仓库和数据挖掘的概念和技术,又介绍了它们之间的关系,以及今后的发展。

在数据仓库的章节中,重点介绍数据仓库原理、联机分析处理、数据仓库设计与开发、数据仓库的决策支持应用。在数据挖掘的章节中重点介绍信息论方法、集合论方法、公式发现、神经网络和遗传算法,这些数据挖掘方法在现实中应用较广泛。由于数据挖掘的基础理论涉及面较宽,建议在本科生教学中对信息论原理和集合论方法只讲定义和例子,对神经网络和遗传算法只讲公式和应用,省略原理的深层内容和公式的推导。这些省略的内容适合研究生教学。

由于作者从事数据仓库与数据挖掘工作多年,并得到过国家自然科学基金项目的资助。在书中还介绍了作者领导的课题组完成的IBLE决策规则树方法、FDD公式发现系统、遗传分类学习系统GCLS等。本书也包含了作者提出的综合决策支持系统概念和可拓数据挖掘概念及理论,这些内容适合研究生学习和参考。

欢迎和广大读者进行交流,共同为促进我国数据仓库和数据挖掘的发展而努力。

参加本书录入的有毕季明、廖建文、赵健、徐怡峰、田昊等同志,在此表示感谢!

陈文伟

2006年5月29日于广州