数据挖掘实用案例分析(第2版)
提供课件、代码,咨询QQ:2301891038(仅限教师)。"(1)系统性比较强,基本覆盖了数据挖掘领域的主流应用领域。 (2)紧贴实际应用,案例丰富,强调实验,培养学生动手能力。 (3)强调案例的原创性,配套资料齐全。 "

作者:赵卫东、董亮

丛书名:大数据技术与应用专业系列教材

定价:89元

印次:2-1

ISBN:9787302658092

出版日期:2024.03.01

印刷日期:2024.03.20

图书责编:闫红梅

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

数据挖掘已经广泛应用于各行各业,并推动了商务数据分析的兴起。本书结合项目实践,首先对数据挖掘的核心问题进行总结,讨论数据挖掘过程的主要步骤。在此基础上,使用Python语言详细地分析 数据 可视化、随机森林、GBDT、XGBoost、AdaCostBoost、逻辑回归等 在医疗保险稽核、淡水质量预测、弹幕 情感分析、机器学习书籍市场分析、慢性肾脏病状态预测、 行车记录仪销量分析、商务酒店竞争分析等典型领域的应用。 全书内容深入浅出,案例生动形象,应用性强,可以作为高等学校相关专业“数据挖掘”“商务数据分析”等课程的实验和实训教材,也适合对数据分析感兴趣的广大读者使用。

赵卫东,复旦大学计算机科学技术学院副教授,主要负责本科生和各类研究生大数据核心技术和商务数据分析、机器学习等课程的教学,被评为教育部在线教育研究中心“智慧教学之星”。商务智能被评为上海市精品课程、全国高校人工智能大数据教育教学“创新奖”,获得2013年高等教育上海市教学成果奖二等奖和2022年一等奖。获得2022年复旦大学教师教学创新大赛一等奖。获得2022年教育部-华为智能基座项目深度学习课程优秀课件。目前主要研究方向包括机器学习和深度学习应用、电子推荐和大数据分析等。主持国家自然科学基金2项、国家重点研发计划子课题、上海市浦江人才以及企业合作课题等40多项。已在Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers,Intelligent Data Analysis,Applied Intelligence等国内外刊物发表论文100多篇。

前言 目前,市场上单纯地介绍数据挖掘理论的教材比较多,这类教材在国内存在着以下明显问题: 一是数据挖掘的应用案例比较粗略,问题也比较简单,分析过程不具体,难以支撑数据挖掘的实验和实训教学,而实践教学却是培养数据分析应用人才非常重要、不可或缺的环节; 二是数据量比较小,分析的问题只是实际问题的模拟,数据分析的深度、算法的复杂度还达不到数据挖掘教学的要求; 三是难度适中、适合教学、能满足实战性要求的教材不多。本书是作者针对目前数据挖掘对学生实践能力要求高的特点,通过分析目前高等学校“数据挖掘”课程教学的痛点,即与实际应用结合不紧密等问题而编写的实验、实训教材。 作者深耕数据挖掘多年,与企业合作成功实施了多项数据分析的项目,熟悉数据挖掘的基本原理,并对Python编程比较熟悉,积累了一些详细的案例,这为本书的写作奠定了基础。 Python语言在高等学校已经被各类专业的大学生选修,数据分析也成为一种基本的技能。为适应高等学校“数据挖掘”课程的教学,本书使用Python语言对原有的部分案例进行重新改写,并且增加了几个综合性的案例。 本书是在第1版的基础上进行的修订、改版。书中使用Tableau、Python等数据分析工具和语言,通过精心选择应用场景、设计面向实际问题的解决思路,突出数据分析过程中常遇到的问题。学生参考这些案例,不仅能消化理解Python主流机器学习库的基本用法,还能针对实际问题进行一定深度的分析,具有较强的实用性。此外,学生可以模仿实验,举一反三,针对新问题提出合理的解决思路。 本书还引进了Intel公司的机器学习...

课件下载

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情

目录

第1章数据分析基础

1.1业务理解

1.2数据理解

1.3数据质量问题与预处理

1.4数据分析常见陷阱

1.5数据分析方法的选择

1.5.1分类算法

1.5.2聚类算法

1.5.3关联分析

1.5.4回归分析

1.5.5深度学习

1.5.6统计方法

1.6数据分析结果的评价

1.6.1分类算法的评价

1.6.2聚类结果的评价

1.6.3关联分析的评价

1.6.4回归分析结果的评价

1.7数据分析团队的组建

1.7.1项目经理

1.7.2业务专家

1.7.3数据工程师

1.7.4数据建模人员

1.7.5可视化人员

1.7.6评估人员

1.8数据分析人才培养的难题

1.8.1数理要求高

1.8.2跨学科综合能力欠缺

1.8.3国内技术资料少

1.8.4实践机会少

思考题

第2章Anaconda的安装与使用

2.1Anaconda的下载与安装

2.2配置Python库

2.3创建自定义新环境

2.4集成开发环境的使用

2.5搭建GPU环境

思考题

第3章医疗保险稽核

3.1数据预处理

3.1.1特征选择

3.1.2数据清洗

3.1.3数据离散化

3.1.4特征值处理

3.1.5数据平衡

3.1.6样本权重系数设置

3.1.7数据转换

3.2医疗保险稽核建模和评估

3.3结果分析

...

本书评为国家级实验教学示范中心联席会计算机学科组“十四五”规划教材,全书内容深入浅出,案例生动形象,原创性强,可以作为高校相关专业数据挖掘、机器学习等课程的实验和实训教材,也可以供学习数据分析的社会人士参考。