前 言
《R数据科学实战(第2版)》是我们在自学时所希望拥有的书,它所汇集的主题和技能被称为数据科学。《R数据科学实战(第2版)》也是我们想分发给客户和同行的书。它的目的是解释统计学、计算机科学和机器学习等学科中对数据科学至关重要的内容。
数据科学利用了来自经验科学、统计学、报表技术、分析技术、可视化技术、商业智能、专家系统、机器学习、数据库、数据仓库、数据挖掘和大数据技术的各种工具。正是因为我们有太多的工具,所以需要一个涵盖所有工具的指导原则。数据科学本身与这些工具和技术的区别就在于数据科学的中心目标是将有效的决策模型部署到生产环境中。
我们的目标是从务实的、面向实践的角度来展示数据科学。我们通过聚焦在完全成功的真实数据上的示例来实现这一目标,《R数据科学实战(第2版)》展示了超过10个重要的数据集。我们认为这种方法能举例说明我们真正想要达到的教学目标,并能演示实际项目中所需要的各种准备步骤。
在《R数据科学实战(第2版)》中,我们讨论了实用的统计学和机器学习的概念,包括具体的代码示例,并探索了与非专业人员的合作和沟通方式。如果你觉得这些话题中没有新颖的主题,那么我们希望《R数据科学实战(第2版)》内容能为你最近没有想到的其他一两个话题提供一些启示。