





定价:98元
印次:1-1
ISBN:9787302641865
出版日期:2023.08.01
印刷日期:2023.08.30
图书责编:王军
图书分类:零售
"数据科学项目日益增多,每个项目在提出原型到生产的过程中都需要可靠的基础设施。使用《Effective数据科学基础设施》介绍的一些新技术和新工具,你将能建立一个适用于各类组织(无论是初创企业还是大型企业)的基础设施堆栈。 《Effective数据科学基础设施》可帮助你建立数据流程和项目工作流,为你开发项目带来强大动力。《Effective数据科学基础设施》呈现Netflix数据操作的**进工具和概念,并在此基础上介绍一种可定制的基于云的模型开发和MLOps方法,可轻松适应公司的特定需求。当团队把数据科学和机器学习应用于广泛的业务问题时,这些实用的数据流程将更高效地生成更完美的结果。 主要内容 ● 在云中处理计算和编排 ● 将基于云的工具耦合到一个内聚的数据科学环境中 ● 使用Metaflow、AWS和Python数据生态系统开发可复制的数据科学项目 ● 构建需要大型数据集和模型,需要数据科学家团队参与的复杂应用程序"
Ville Tuulos在Netflix公司设计并构建了用于数据科学的全栈框架Metaflow。目前,Ville在一家专业开发数据科学基础设施的初创公司担任首席执行官。
前 言 我在十几岁时,对人工智能产生了浓厚的兴趣。13岁时,我训练了我的第一个人工神经网络。我从零开始,用C和C++实现了简单的训练算法,这是20世纪90年代时探索该领域的唯一方法。此后,我继续学习了计算机科学、数学和心理学,以更好地理解这一庞大主题的基础。当时,机器学习(数据科学这个术语还不存在)的应用方式有时似乎更像魔术,而不是真正的科学或原理工程。 后来,我从学术界转向大公司和初创公司,此后,我一直在构建支持机器学习的系统。Linux等开源项目和当时新兴的Python数据生态系统对我的影响很大。Python数据生态系统提供了NumPy等包,与C或C++相比,这些包使得构建高性能代码更容易。除了开源的技术优势,我还发现围绕这些项目形成了十分创新、充满活力且广受欢迎的领域。 当我在2017年加入Netflix,受命从零开始构建新的机器学习基础设施时,我秉持着3个原则。首先,我们需要对全栈有一个原则性的理解——数据科学和机器学习不是魔术,而需要成为一门真正的工程学科。其次,无论是出于技术角度还是因为其庞大的包容性领域,我都确信Python是新平台的基础。最后,归根结底,数据科学和机器学习是人类使用的工具。使用工具的唯一目的是提高工作效率,成功的工具还可提供令人愉悦的使用体验。 工具是由孕育其诞生的文化塑造的。我创建了开源工具Metaflow后,Netflix的文化对其产生了巨大的影响,该工具后来成为一个强劲的开源项目。Netflix的发展压力确保了Metaflow和我们对整个数据科学堆栈的理解都是基于数据科学家的实际需求。 Netflix给予其数据科...
第1章 数据科学基础设施介绍 1
1.1 选择数据科学基础设施的原因 2
1.2 什么是数据科学基础设施 5
1.2.1 数据科学基础设施堆栈 6
1.2.2 支持数据科学项目的整个生命周期 8
1.2.3 不能以偏概全 9
1.3 良好基础设施的重要性 10
1.3.1 管理复杂性 11
1.3.2 利用现有平台 12
1.4 以人为中心的基础设施 13
1.4.1 自由与责任 14
1.4.2 数据科学家自主性 15
1.5 本章小结 16
第2章 数据科学的工具链 17
2.1 建立开发环境 18
2.1.1 云账户 21
2.1.2 数据科学工作站 22
2.1.3 笔记 24
2.1.4 归纳 27
2.2 介绍工作流 29
2.2.1 工作流基础 30
2.2.2 执行工作流 31
2.2.3 工作流框架 33
2.3 本章小结 35
第3章 Metaflow简介 37
3.1 Metaflow的基本概念 38
3.1.1 安装Metaflow 39
3.1.2 编写基本工作流 40
3.1.3 管理工作流中的数据流 44
3.1.4 参数 50
3.2 分支和合并 55
3.2.1 有效的DAG结构 56
3.2.2 静态分支 57
3.2.3 动态分支 61
3.2.4 控制并发 64
3.3 Metaflow实际应用 66
3.3.1 启动新项目 67
3.3.2 使用客户端API访问结...
同系列产品
查看详情-
构建大模型数据科学应用:从机器学习升级到大模型
[美] 克里斯汀·科勒(Kristen Kehrer) 凯莱布·凯撒(Caleb Kaiser)著 王奕逍 译
ISBN:9787302685838
定 价:49.8元
-
极速Python:高性能编码、计算与数据分析
[美] 蒂亚戈·罗德里格斯·安道(Tiago Rodrigues Antao)著 沈冲 译
ISBN:9787302656296
定 价:79.8元
-
Python贝叶斯建模与计算
[阿根廷] 奥斯瓦尔多·A. 马丁(Osvaldo A. Martin),[美]拉万·库马尔(Ravin Kumar)[美]劳俊鹏(Junpeng Lao)著 郭涛 译
ISBN:9787302654858
定 价:98元
-
漫画算法与数据结构(大规模数据集)
[波黑]黛拉·梅杰多维奇(Dzejla Medjedovic) 埃明·塔希罗维奇(Emin Tahirovic)著 伊内斯·德多维奇(Ines Dedovic) 绘 郭涛 袁洪斌 译
ISBN:9787302645207
定 价:79.8元