





作者:[美]盖丽特·徐茉莉(Galit Shmueli),[美]彼得·C.布鲁斯(Peter C. Bruce),[美]彼得·戈德克(Peter Gedeck),[美]尼廷·R.帕特尔(Nitin R. Patel) 著; 吴文国,金柏琪 译
定价:118元
印次:1-2
ISBN:9787302590248
出版日期:2021.11.01
印刷日期:2023.09.13
图书责编:王军
图书分类:零售
本书前5版好评如潮,作为第6版,本书首次使用了Python语言。本书除了介绍用于统计和机器学习等领域的预测、分类、可视化、降维、推荐系统、聚类、文本挖掘、网络分析等方法之外,内容还包括: ● 新加入的合著者Peter Gedeck拥有使用Python讲解商业分析课程的丰富经验以及将机器学习应用于新药发现过程的专业技能。在本书中,他十分乐于将这些经验和技能与读者分享。 ● 讨论数据挖掘中的伦理问题。 ● 根据教师和学生的反馈意见对内容做了更新。 ● 通过多个案例展示数据挖掘技术的实际应用。 ● 每章后面的习题有助于读者评估和加深对该章内容的理解。 ● 在线支持网站提供了数据集、教学资料、习题答案、PPT教案和案例解决方案。
Galit Shmueli博士自2004年以来,一直在美国马里兰大学、statistics.com统计网站、印度商学院设计并指导数据挖掘课程。Shmueli的研究领域包括信息系统的统计方法和数据挖掘,她以研究和擅长讲授商业分析而闻名,并发表了100多篇文章。Peter C. Bruce是statistics.com统计网站的统计教育研究院的主席和创办人,他发表了多篇学术论文,还开发了Resampling Stats软件。Peter Gedeck博士是Collabrative Drug Discovery公司的高级数据科学家,他为这家公司开发了一款基于云的软件来管理新药发现过程中用到的海量数据,他还在statistics.com统计网站上教授数据挖掘课程。Nitin R. Patel博士是位于马萨诸塞州剑桥市的Cytel公司的共同创始人和董事,是美国统计协会会员,同时还是麻省理工学院和哈佛大学的客座教授。
前 言 本书最早出版于2007年年初,已被众多学生、从业人员和任课老师采用,包括我本人,在过去15 年里,在线授课和面对面授课都以本书为重要参考书。本书的第1 版是基于Excel 加载项(加载程序是Analytic Solver Data Mining,早先的名称是XLMiner)的,此后不断推出JMP 版本、R 版本和现在的Python 版本,并推出了本书的合作站点——www.dataminingbook.com。 新推出的Python 版本使用了免费开源的Python 程序设计语言。本书提供了Python 程序的输出结果以及生成这些结果的代码,也包含相关程序包和函数的使用说明,其中的核心是scikit-learn 包。不同于计算机科学教材或统计学教材,本书的重点在于数据挖掘的基本概念以及如何用Python 实现相关算法。我们假设读者基本熟悉Python 语言。 对于新推出的Python 版本,增加了另一位共同作者——Peter Gedeck,他在商业领域里具有丰富的数据科学经验。除了提供Python 代码和输出结果外,本书也增加了最新内容和反馈意见。这些意见来自教授MBA 课程、MS 课程、本科生课程、文凭课程和经理人培训课程的老师及学生。最重要的是,本书首次引入了有关数据伦理的内容(详见2.9 节)。 本书还包含原书第3 版新增的如下内容: ● 社交网络分析 ● 文本挖掘 ● 集成方法 ● 增益模型协同过滤 自第2 版开始(基于Analytic Solver),以本书为教材的课程大量增加。最初,本书主要用于一学期的MBA 选修课,现在已被用...
第1 章 引言............................................................3
1.1 商业分析简介...........................................3
1.2 什么是数据挖掘......................................4
1.3 数据挖掘及相关术语..............................4
1.4 大数据........................................................5
1.5 数据科学...................................................6
1.6 为什么有这么多不同的方法.................6
1.7 术语与符号...............................................7
1.8 本书的线路图...........................................8
第2 章 数据挖掘过程概述................................11
2.1 引言..........................................................11
2.2 数据挖掘的核心思想............................11
2.2.1 分类..................
同系列产品
查看详情-
构建大模型数据科学应用:从机器学习升级到大模型
[美] 克里斯汀·科勒(Kristen Kehrer) 凯莱布·凯撒(Caleb Kaiser)著 王奕逍 译
ISBN:9787302685838
定 价:49.8元
-
极速Python:高性能编码、计算与数据分析
[美] 蒂亚戈·罗德里格斯·安道(Tiago Rodrigues Antao)著 沈冲 译
ISBN:9787302656296
定 价:79.8元
-
Python贝叶斯建模与计算
[阿根廷] 奥斯瓦尔多·A. 马丁(Osvaldo A. Martin),[美]拉万·库马尔(Ravin Kumar)[美]劳俊鹏(Junpeng Lao)著 郭涛 译
ISBN:9787302654858
定 价:98元
-
漫画算法与数据结构(大规模数据集)
[波黑]黛拉·梅杰多维奇(Dzejla Medjedovic) 埃明·塔希罗维奇(Emin Tahirovic)著 伊内斯·德多维奇(Ines Dedovic) 绘 郭涛 袁洪斌 译
ISBN:9787302645207
定 价:79.8元