内容简介

"《Python大数据分析师的算法手册》系统阐述大数据分析方法中的关键算法与实践,重点聚焦数据特征分析及第三方开源库的场景化应用。通过工具整合与实例讲解,为读者提供从理论到实践的完整学习路径。本书配套示例源码、PPT课件。

《Python大数据分析师的算法手册》共9章。第1章概述大数据分析;第2章讲解数据特征算法分析;第3~7章讲解主流开源的分析工具的用法,包括NumPy、SciPy、Matplotlib、Pandas、StatsModels、Gensim等;第8章讲解分类、聚类、回归、关联规则学习、推荐算法、时间序列分析、异常检测、自然语言处理、深度学习、图算法、优化算法、流数据处理等算法及其示例;第9章给出5个典型案例,包括文本分析与情感分析、金融大数据分析、社交网络分析、地理数据分析、城市交通数据分析。本书所有示例均在Anaconda3开发环境中调试通过,实验数据多源自GitHub公开资源,并附有完整源代码,便于读者复现与拓展。

《Python大数据分析师的算法手册》内容兼顾技术深度与实用性,适合大数据分析算法初学者、大数据分析人员、大数据研究人员阅读,也可以作为计算机科学与工程、大数据分析、人工智能、统计学和社会科学等专业的大学生或研究生的专业参考书。"