图书前言

前  言 

本书旨在介绍流行的特征工程技术,讨论何时以及如何运用这些技术的框架。我发现,有些书籍只关注其中一方面,有时可能显得有些单薄。专注于概述的书籍往往忽略了实际应用的一面,而专注于框架的书籍可能让读者产生疑问:“为什么这样做有效呢?”我希望读者在理解和应用这些技术方面都能充满信心。

本书目标读者

本书面向已经踏入机器学习领域并寻求提升能力与技能的机器学习工程师和数据科学家。假设读者已经掌握机器学习、交叉验证、参数调优以及使用Python 和scikit-learn 进行模型训练的基础知识。

本书在此基础上进一步拓展,将特征工程流程直接融入现有的机器学习框架中,以提供更深入的学习体验。

本书的学习路线图

本书包含两个导论性章节(第1~2 章),涵盖了特征工程的基础知识,包括如何识别不同类型的数据以及特征工程的不同类别。第3~8 章的每一章都专注于一个具体的案例研究,使用不同的数据集和目标。每章都为读者提供一个新的视角、一个新的数据集以及特定于我们处理的数据类型的新的特征工程技术。本书的目标是提供关于特征工程技术种类的广泛而全面的知识,同时展示各种数据集和数据类型。

关于代码

本书涵盖了许多源代码示例,它们以编号的代码清单和正常文本行的形式呈现。在两种情况下,源代码都采用等宽字体的格式,以便与普通文本区分开来。有时,代码也以粗体显示,用于突出显示在相应章中与之前步骤不同的代码,例如当新特性添加到现有代码行时。

许多情况下,源代码经过重新格式化;我们添加了换行符并重新调整了缩进,以适应书中可用的页面空间。某些情况下,这样做仍不够,代码清单中会包含续行标记(➥)。代码清单中附带了许多注释,用于突出显示重要的概念。

可扫描封底二维码下载代码。