首页 > 图书中心 >图书详情

Python商业数据挖掘(第6版)

用Python展示数据挖掘的理论、技术和应用。随书赠送学习资料,获取地址见书封底二维码。

作者:[美]盖丽特·徐茉莉(Galit Shmueli),[美]彼得·C.布鲁斯(Peter C. Bruce),[美]彼得·戈德克(Peter Gedeck),[美]尼廷·R
丛书名:数据科学与大数据技术
定价:118
印次:1-2
ISBN:9787302590248
出版日期:2021.11.01
印刷日期:2023.09.13

本书前5版好评如潮,作为第6版,本书首次使用了Python语言。本书除了介绍用于统计和机器学习等领域的预测、分类、可视化、降维、推荐系统、聚类、文本挖掘、网络分析等方法之外,内容还包括: ● 新加入的合著者Peter Gedeck拥有使用Python讲解商业分析课程的丰富经验以及将机器学习应用于新药发现过程的专业技能。在本书中,他十分乐于将这些经验和技能与读者分享。 ● 讨论数据挖掘中的伦理问题。 ● 根据教师和学生的反馈意见对内容做了更新。 ● 通过多个案例展示数据挖掘技术的实际应用。 ● 每章后面的习题有助于读者评估和加深对该章内容的理解。 ● 在线支持网站提供了数据集、教学资料、习题答案、PPT教案和案例解决方案。

more >

前 言 本书最早出版于2007年年初,已被众多学生、从业人员和任课老师采用,包括我本人,在过去15 年里,在线授课和面对面授课都以本书为重要参考书。本书的第1 版是基于Excel 加载项(加载程序是Analytic Solver Data Mining,早先的名称是XLMiner)的,此后不断推出JMP 版本、R 版本和现在的Python 版本,并推出了本书的合作站点——www.dataminingbook.com。 新推出的Python 版本使用了免费开源的Python 程序设计语言。本书提供了Python 程序的输出结果以及生成这些结果的代码,也包含相关程序包和函数的使用说明,其中的核心是scikit-learn 包。不同于计算机科学教材或统计学教材,本书的重点在于数据挖掘的基本概念以及如何用Python 实现相关算法。我们假设读者基本熟悉Python 语言。 对于新推出的Python 版本,增加了另一位共同作者——Peter Gedeck,他在商业领域里具有丰富的数据科学经验。除了提供Python 代码和输出结果外,本书也增加了最新内容和反馈意见。这些意见来自教授MBA 课程、MS 课程、本科生课程、文凭课程和经理人培训课程的老师及学生。最重要的是,本书首次引入了有关数据伦理的内容(详见2.9 节)。 本书还包含原书第3 版新增的如下内容: ● 社交网络分析 ● 文本挖掘 ● 集成方法 ● 增益模型协同过滤 自第2 版开始(基于Analytic Solver),以本书为教材的课程大量增加。最初,本书主要用于一学期的MBA 选修课,现在已被用在许多商业分析学位课的教学大纲里和证书课程的教学计划里。从本科生教学计划到研究生和经理人培训计划,这些项目里的课程、时间长短不一,深浅不同。在很多情形 下,本书可用在多门课程里。本书的设计思想是继续支持通用的“预测分析”或“数据挖掘”课程,但是也支持专用的商业分析教学大纲。 在专用的商业分析教学大纲中,以下课程曾使用本书。 ● 预测分析——监督学习:在专用的商业分析项目里,对于预测分析主题,通常包括一系列课程。第一门课程包括本书的第Ⅰ部分至第Ⅳ部分内容。教授这门课程的老师通常根据课时适当地选择第Ⅳ部分的内容。在这类课程中,建议包括第13 章的集成学习和第Ⅶ部分的数据分析。 ● 预测分析——无监督学习:本课程介绍数据探索和可视化、降维、挖掘关系和聚类(第Ⅲ部分和第Ⅴ部分)。如果这门课程也按照“预测分析——监督学习”课程的教学计划,那么有必要分析综合应用无监督学习和监督学习的例子和方法。 ● 预测分析:专门用于时间序列预测的课程需要用到第Ⅵ部分的内容。 ● 高级分析:本课程综合了全部的预测分析内容(包括监督学习和无监督学习)。这门课程的重点应放在第Ⅶ部分。这部分包含了社交网络分析和文本挖掘。有的老师也会在这类课程中选择第21 章中的案例。 在以上所有课程中,我们强烈建议增加课程设计项目,要求学生自己收集数据,或利用老师提供的数据(例如,现在有很多供数据挖掘使用的数据集)。根据我们和其他老师的经验,这些项目可让学生巩固所学的知识,并且能给学生提供一个机会,以便更好地理解数据挖掘的强大功能以及在挖掘过程中遇到的问题。 ——Galit Shmueli、Peter C. Bruce、Peter Gedeck 和Nitin R. Patel 2019 年

more >
扫描二维码
下载APP了解更多

同系列产品more >

极速Python:高性能编码、计算与数...

[美] 蒂亚戈·罗德里格斯
定 价:79.80元

查看详情
Python贝叶斯建模与计算

[阿根廷] 奥斯瓦尔多·A.
定 价:98元

查看详情
漫画算法与数据结构(大规模数据集)...

[波黑]黛拉·梅杰多维奇
定 价:79.80元

查看详情
不学编程做R统计分析:图形界面R C...

[加]约翰·福克斯(John
定 价:59.80元

查看详情
Python和PySpark数据分析

[加] 乔纳森·里乌 (Jon
定 价:118元

查看详情
图书分类全部图书
more >
  • Galit Shmueli博士自2004年以来,一直在美国马里兰大学、statistics.com统计网站、印度商学院设计并指导数据挖掘课程。Shmueli的研究领域包括信息系统的统计方法和数据挖掘,她以研究和擅长讲授商业分析而闻名,并发表了100多篇文章。
    Peter C. Bruce是statistics.com统计网站的统计教育研究院的主席和创办人,他发表了多篇学术论文,还开发了Resampling Stats软件。
    Peter Gedeck博士是Collabrative Drug Discovery公司的高级数据科学家,他为这家公司开发了一款基于云的软件来管理新药发现过程中用到的海量数据,他还在statistics.com统计网站上教授数据挖掘课程。
    Nitin R. Patel博士是位于马萨诸塞州剑桥市的Cytel公司的共同创始人和董事,是美国统计协会会员,同时还是麻省理工学院和哈佛大学的客座教授。

  • 通过学习《Python商业数据挖掘(第6版)》,读者将掌握使用Python实现数据挖掘的各种方法,并深入理解在将这些方法应用于数据挖掘的过程中存在的商业问题和机遇。
more >
  • 第I 部分 预备知识

    第1 章 引言............................................................3

    1.1 商业分析简介...........................................3

    1.2 什么是数据挖掘......................................4

    1.3 数据挖掘及相关术语..............................4

    1.4 大数据........................................................5

    1.5 数据科学...................................................6

    1.6 为什么有这么多不同的方法.................6

    1.7 术语与符号...............................................7

    1.8 本书的线路图...........................................8

    第2 章 数据挖掘过程概述................................11

    2.1 引言..........................................................11

    2.2 数据挖掘的核心思想............................11

    2.2.1 分类..................

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘