《Effective数据科学基础设施》由Netflix工程师Ville Tuulos撰写,以Metaflow为对象,介绍了数据科学所需要的基础设施,囊括数据准备、特征工程、模型训练、模型部署、服务和持续监控等环节。Metaflow专注于构建生产流程,更适合具有深厚工程和DevOps技能的大型专业数据科学团队。本书的目标读者为数据科学家、机器学习工程师、IT 技术人员和MLOps工程师。数据科学家在人工智能和算法方面非常精通,但软件开发能力通常不足。他们渴望有一套方法论和工具来促进从构建到部署的迭代过程,从而落实自己的想法。数据科学家不在意在一个“孤岛”。上开展数据挖掘和分析工作,他们更希望能够在离线、实时和批处理等场景中落实项目。IT技术人员对机器学习算法理论和模型细节并不了解,他们渴望本书能够提供一个机器学习流程的全貌,便于他们进行任务编排。此外,一些企业的中高层管理人员可通过本书获取MLOps管理理念,为制定AI项目管理和KPI考核提供参考依据。总之,与传统的软件工程师技能要求相比,MLOps工程师除了需要具备现代软件工程所要求的强大能力,还需要具备ML专业知识,具体包括ML模型训练、模型部署、模型监控和帮助企业落实架构、系统设计和故障排除等能力。