首页 > 图书中心 >图书详情
分布式数据库系统原理(第4版)
作者:(德)塔姆尔·厄兹叙(M. Tamer ?zsu),帕特里克·瓦尔杜里兹(Patrick Valduriez) 著 范举 等译
丛书名:清华计算机图书译丛
定价:99元
印次:2-1
ISBN:9787302636526
出版日期:2023.07.01
印刷日期:2023.07.25
本书主要介绍分布式数据库管理系统的基本概念、基本理论和设计问题,涵盖了分布式数据库系统的设计、实现和管理等方面的诸多专题。全书由两大部分组成, 第一部分包括第1~14章,以关系数据库为主,讲述了分布式数据管理的基础原理,内容包括分布式数据库设计,分布式查询的分解与优化,事务管理,分布式并发控制,分布式数据库管理系统的可靠性,数据复制等分布式数据管理技术的经典内容,第14章还讨论了并行数据库系统。第二部分包括第15~18章,介绍了互联网时代分布式数据管理研究的前沿,包括分布式对象数据库管理,P2P数据管理,万?
more >前??言 在本书第1版出版的1991年,分布式数据库技术还很新,市面上的产品也不是很多。在第1版的前言中,我们引用了Michael Stonebraker的话——他在1988年提出,在接下来的 10 年中,集中式DBMS 将成为一种“古董”,大多数组织将转向分布式DBMS。可以说,Michael Stonebraker的这一预测被证明是正确的,当今使用的大部分数据库系统都是分布式或并行的,它们通常也称为横向扩展系统。另外,在我们撰写本书第1版时,本科生和研究生的数据库课程并不像现在这样普及。因此,本书的第1版在介绍分布式/并行解决方案之前对集中式解决方案做了详尽介绍。然而,随着时代的变化,现在已经很难找到不具备数据库基本知识的研究生了。因此,一本关于分布式/并行数据库技术的研究生教材在今天需要有不同的定位。这正是我们在这一版本中的目标,我们同时还保留了第3版引入的许多新内容。具体而言,我们在第4版中引入的主要修订如下: (1)多年来,分布式数据库系统的动机和环境均发生了变化(如Web、云等的出现)。鉴于此,对分布式数据库技术进行整体介绍的章节需要进行更新。因此,我们修改了引言部分,以便可以从更为现代的视角看待这项技术。 (2)我们新增了一个关于大数据处理的章节,涵盖了分布式存储系统、数据流处理、MapReduce与Spark 平台、图分析和数据湖的内容。随着上述系统的激增,系统地对它们进行介绍是必不可少的。 (3)类似地,我们通过新的一章来介绍NoSQL系统日益增长的影响。该章涵盖了4种类型的 NoSQL系统,即键值存储、文档存储、宽列系统和图DBMS,此外还涵盖了NewSQL和Polystore系统。 (4)我们把第3版中的数据库集成和多数据库查询处理章节合并为一个数据库集成 章节。 (5)我们对之前主要关注XML的Web数据管理章节进行了大幅修订,重新聚焦目前更常见的RDF技术。我们也在相关章节中讨论了Web数据集成方法,同时涵盖数据质量这一重要问题。 (6)我们修订了P2P数据管理章节,大幅新增了对区块链的介绍。 (7)为了使前面的章节更为简洁,我们删除了基本的集中式技术,已压缩查询处理和事务管理的相关章节,并将这些章节的重点放在分布式/并行技术上。同时,我们在这些章节中增加了一些近来重要的内容,例如动态查询处理技术(eddies),以及Paxos共识算法及其在提交协议中的使用。 (8)我们更新了并行DBMS的章节,阐明了系统的目标,特别是对比了纵向扩展与横向扩展,并介绍了包括UMA与NUMA的并行架构。此外,我们还新增了一个小节来介绍并行排序算法和并行连结算法的不同解决方案,从而探讨如何利用当今常见的大内存和多核处理器。 (9)我们更新了分布式设计章节,大幅增加了一些同时结合了数据分片和站点分配的现代方法。通过重新梳理材料,目前该章节是面向分布式/并行数据划分内容的核心章节。 (10)尽管对象技术持续在信息系统中发挥作用,但它在分布式/并行数据管理中的重要性已经下降。因此,这一版本删除了关于对象数据库的章节。 很明显,我们采用更为现代的处理方式对整本书和每一章进行了修订和更新。同时,我们仍保留了在此过程中删除的材料——这些材料作为在线附录包含在本书的官方网站上(https://cs.uwaterloo.ca/ddbs)。为了保持本书的合理篇幅(这也使价格保持合理),我们选择在线提供这些内容而不将它们纳入印刷版本。网站还包括基于本书的教学课件以及大多数习题的参考答案(仅开放给采用本书进行教学的教师)。 与之前的版本一样,许多同事为本书第4版的完成提供了帮助,在此感谢他们(排名不分先后)。Dan Olteanu在第3章中对可以显著减少物化视图维护时间的两种优化方法进行了很好的探讨。Phil Bernstein提供了有关多版本事务管理的新论文,这些论文指导了第5章的更新。Khuzaima Daudjee提供了关于分布式事务处理的新参考文献,这些文献已被添加到第5章的参考文献说明部分。Ricardo Jimenez Peris为第5章撰写了有关高性能事务系统的内容,他还为第11章撰写了关于LeanXcale的部分。Dennis Shasha审阅了P2P章节中关于区块链的部分。Michael Carey审阅了第10章、第11章和第8章的内容,给出了非常详细的建议,极大地改进了这些章节。Tamer的学生Anil Pacaci、Khaled Ammar和博士后Xiaofei Zhang审阅了有关大数据的章节,他们发表的论文中的一些内容也包含在该章中。第11章(NoSQL、NewSQL和Polystores)涵盖了Boyan Kolev和Patrick的学生Carlyna Bondiombouy所发表论文中的内容。Jim Webber审阅了第11章中有关Neo4j的部分。第11章中图分析系统的特征部分基于Minyang Han的硕士论文,他还提出了该章介绍的GiraphUC方法。Semih Salihoglu和Lukasz Golab也审阅了该章的部分内容并提供了非常有帮助的建议。Alon Halevy针对第12章中的WebTables提出了建议。Ihab Ilyas和Xu Chu对Web数据集成中的数据质量进行了讨论。Stratos Idreos介绍了如何使用database cracking进行数据划分,并为第2章撰写了相关的内容。Renan Souza和Fabian St?ter审阅了整 本书。 本书的第3版引入了许多新主题,这些主题延续到了这一版,许多同事在撰写这些章节时发挥了很大的作用。我们想再次感谢他们的帮助,因为他们的影响也反映在当前版本中。Renée Miller、Erhard Rahm和Alon Halevy在整理关于数据库集成的讨论方面发挥了关键作用,Avigdor Gal对相关章节进行了全面的审阅。Matthias Jarke、Xiang Li、Gottfried Vossen、Erhard Rahm和Andreas Thor为相关章节贡献了习题。Hubert Naacke为异构代价建模部分做出了贡献,Fabio Porto为自适应查询处理部分做出了贡献。如果没有Gustavo Alonso和Bettina Kemme的帮助,我们无法撰写关于数据复制的内容(第6章)。Esther Pacitti也通过审阅和提供背景材料为数据复制章节做出了贡献;她还参与了并行DBMS一章中有关数据库集群复制的部分。P2P数据管理在很大程度上要归功于与Beng Chin Ooi的讨论。本章关于P2P 系统中查询处理的部分使用了Reza Akbarinia和Wenceslao Palma的博士工作中的材料,而关于复制的部分,则使用了Vidal Martins的博士工作中的材料。 我们要感谢Springer的编辑Susan Lagerstrom-Fife在Springer内部推动这个项目,并督促我们及时完成本书。我们几乎错过了她所有的截止日期,但我们希望最终结果是令人满意的。 最后,我们愿意听取读者对本书的意见和建议。我们欢迎任何方面的反馈,但我们更加希望收到以下方面的意见与建议: (1)尽管我们尽了最大努力,但可能仍然存在任何错误(我们希望不会有很多); (2)任何应该删减、添加或扩展的主题; (3)您设计的任何习题,如果您希望将其纳入本书中。 M. Tamer ?zsu (tamer.ozsu@uwaterloo.ca) Patrick Valduriez (patrick.valduriez@inria.fr) 4 分布式数据库系统原理(第4版) 5 前??言
more >