清华大学出版社--图书详情

+教师申领样书

首页 > 图书 > 图书详情

极速Python：高性能编码、计算与数据分析

系统性介绍Python高性能编程的各种工具和方法，重点讲解Python在大数据中的应用。示例代码扫描封底二维码下载。

作者：[美] 蒂亚戈·罗德里格斯·安道（Tiago Rodrigues Antao）著沈冲译

丛书名：数据科学与大数据技术

定价：79.8元

印次：1-2

ISBN：9787302656296

出版日期：2024.03.01

印刷日期：2024.12.23

图书责编：王军

图书分类：零售

电子书

在线购买

京东天猫电子书

内容简介

作者简介

前言序言

资源下载

查看详情查看详情查看详情

《极速Python：高性能编码、计算与数据分析》系统性地介绍了Python高性能编程的各种工具和方法，并重点讲解了Python在大数据中的应用。书中配有清晰的示例和详实的分析，可帮助读者熟练掌握NumPy和Pandas，实现高性能的数据存储和I/O。本书高屋建瓴、不留遗漏，读者学习本书后，能从代码到架构对系统进行整体优化。主要内容 ● 使用Cython重构关键代码。 ● 设计健壮的数据结构。 ● 精简不同架构的代码。 ● 实现Python GPU计算。

"　　Tiago Rodrigues Antão拥有信息学工程学士学位和生物信息学博士学位。他目前从事生物技术工作，使用Python生态来处理科学计算和数据工程任务。大多数时候，他也使用底层编程语言(如C和Rust)对算法的关键部分进行优化。目前，他在基于Amazon AWS的云计算设备上进行开发，但使用的基本是本地计算集群。除了业内经历，他在科学计算方面有两段学术经历，包括在剑桥大学和牛津大学从事数据分析博士后研究工作。作为蒙大拿大学的研究员，他从零开始创建了用于分析生物数据的整套科学计算方法。Tiago是重要生物信息软件包Biopython(用Python编写)的共同作者之一，也是Bioinformatics with Python Cookbook(Packt出版社，2022)一书的作者，该书已出版了第3版。他还在生物信息学领域发表了多篇重要的科研论文。"

前　　言若干年前，我们团队正在使用的基于Python的数据管道突然崩溃，导致某个进程持续占用CPU。该组件对公司业务至关重要，因此必须尽快解决该问题。我们核查了算法，始终没有发现问题。算法的实现步骤其实非常简单，但经过多名工程师的数小时排查，才发现问题在于程序在一个非常大的列表上进行搜索。在将列表转换为集合后，问题就迎刃而解了。最终，数据结构不仅变得更小，搜索时间也从数小时降低到毫秒级别。这次故障对我触动很大： ● 虽然问题并不严重，但暴露出团队在开发过程中并不关注性能问题。如果经常使用代码分析器，我们就能在几分钟内发现问题，而不是耗费了好几个小时。 ● 我们最终解决了问题，并且取得了双赢的结果，不仅程序查询时间更短，占用内存也更少。虽然在许多情况下，面对性能和成本需要做出取舍，但在某些情况下，兼顾两者不仅能获得满意的结果，还没有任何负面影响。 ● 从更高的角度审视，结果也是双赢的。首先，查询速度更快非常有利于公司业务。其次，算法经过优化后，使用CPU的时间更短、耗能更低，也更加环保。 ● 虽然单个案例意义有限，但我意识到许多程序员或许都在寻找类似的优化解决方案。因此，我决定编写本书，以便其他程序员可以从中受益。我的目标是帮助经验丰富的Python程序员设计和实现更高效的解决方案，同时能够了解底层的权衡机制。我将采用全面且透彻的方式，通过探讨Python代码和重要的Python库，从算法角度来探究现代硬件架构及其影响，并分析CPU和存储性能。希望本书能够帮助读者在使用Python生态进行开发时，游刃有余地处理性能问题。关于本...

暂无课件

暂无样章

暂无网络资源

版权信息

扫描二维码
下载APP了解更多

荐语

查看详情查看详情

第Ⅰ部分基础知识

第1章对高效数据处理的迫切需求 3

1.1 数据泛滥的严重性 4

1.2 现代计算架构和高性能计算 6

1.2.1 计算机内部的变化 7

1.2.2 网络的变化 8

1.2.3 云计算 9

1.3 Python的局限性 10

1.4 解决方案小结 11

1.5 本章小结 13

第2章发挥内置功能的最高性能 15

2.1 分析同时具有IO和计算

任务的应用程序 16

2.1.1 下载数据并计算最低温度 16

2.1.2 Python的内置分析模块 18

2.1.3 使用本地缓存 19

2.2 对代码进行分析以检测性能瓶颈 20

2.2.1 可视化分析信息 21

2.2.2 行分析 22

2.2.3 代码分析小结 23

2.3 优化基本数据结构：列表、集合、字典 24

2.3.1 列表搜索的性能 25

2.3.2 使用集合进行搜索 25

2.3.3 Python中的列表、集合和字典的复杂性 26

2.4 节约内存 27

2.4.1 Python内存估算 28

2.4.2 其他表示方法的内存占用 30

2.4.3 使用数组进行紧凑表示 32

2.4.4 串联知识点：估算Python对象的内存占用 33

2.4.5 Python对象内存占用小结 34

2.5 在大数据管道中使用惰性编程和生成器 34

2.6 本章小结 36

第3章并发、并行和异步 37

3.1 编写异步服务器框架 39

3.1.1 实现... 查看详情

《极速Python：高性能编码、计算与数据分析》直击Python编程要害。对于大型数据项目，过慢的代码运行速度是毁灭性的。在机器学习和大规模数据分析中，除了使用高性能的Python代码，还要使用经过优化的库、发挥计算机硬件的多核处理能力。满足计算速度后，还要优化计算资源、控制计算成本，而《极速Python：高性能编码、计算与数据分析》为读者提供了一整套高性能编程解决方案。

查看详情

同系列产品

查看详情

关于我们

新闻资讯

服务支持

关于我们

新闻资讯

服务支持

同系列产品