





定价:89元
印次:1-1
ISBN:9787302542537
出版日期:2020.05.01
印刷日期:2020.04.15
图书责编:王倩
图书分类:学术专著
由于具有良好的表达能力,图数据结构被广泛用来对元素间具有复杂联系的数据进行建模,如社交网络、知识图谱等。因此,可以对大规模图数据进行分析的处理技术逐渐成为当前学术界和业界的热门研究话题之一。目前,已有为数众多的图计算系统被提出和应用,并取得了巨大的商业成功。本书通过将不同环境下图计算系统的数据载入途径分为四个阶段分别进行了研究,总结出了一系列的优化方法,可为相关研究人员提供参考。
“清华大学优秀博士学位论文丛书”(以下简称“优博丛书”)精选自2014年以来入选的清华大学校级优秀博士学位论文(Top 5%)。每篇论文经作者进一步修改、充实并增加导师序言后,以专著形式呈现在读者面前。“优博丛书”选题范围涉及自然科学和人文社会科学各主要领域,覆盖清华大学开设的全部一级学科,代表了清华大学各学科最优秀的博士学位论文的水平,反映了相关领域最新的科研进展,具有较强的前沿性、系统性和可读性,是广大博硕士研究生开题及撰写学位论文的必备参考,也是科研人员快速和系统了解某一细分领域发展概况、最新进展以及创新思路的有效途径。
导师序言 由于具有良好的表达能力,图数据结构被广泛用来对元素间具有复杂联系的数据进行建模。因此,可以对大规模图数据进行分析的处理技术逐渐成为当前学术界和业界的热门研究课题。已有为数众多的图计算系统被提出和应用,并取得了巨大的商业成功。在前人的基础上,本书作者章明星博士持续创新,通过不断地优化图数据在各种不同场景下的载入速度,在多个方向上都取得了重要成果,并在 OSDI、ASPLOS、VLDB、ATC、HPCA、ICS等国际高水平会议上发表了多篇论文。此外他的博士学位论文还获评 ACM SIGSOFT杰出论文,清华大学优秀博士学位论文,北京市优秀博士学位论文, IEEE TCSC卓越奖(优秀博士学位论文)。 更重要的是,章明星博士在研究图计算这一领域的过程中总结出了一整套的系统优化方法。他通过深入分析,根据图计算本身具有数据局部性差、单个点 /边的计算开销小的特点,发现其性能的主要瓶颈在于图数据的载入。基于这一发现,章明星博士将不同场景下的图计算优化统一成一套一致的优化思路,即将整个分布式系统想象成一个多阶的体系结构 (Cache/PIM→内存 →磁盘 /网络 ),然后通过优化每两层之间的局部性来提升整体的运行效率。通过这一思路,在并行图计算、单机内存图计算、单机外存图计算、存算融合加速等多个场景下进行了针对载入瓶颈的细致优化,因而都取得了较大的性能提升。 本书首先描述了现有的图计算系统主要基于一些简单化假设实现这一现象,如点权不可分割、单个计算操作可以孤立地执行等,因此很难达到下层硬件所能支持的最高计算效率。为解决这一问题,作者通过分析发现图计算的主要效率瓶颈在于数据载入...
第 1章引言 .......................................................................................1
1.1大规模图计算 .........................................................................1
1.2图计算系统的分类 ...................................................................2
1.3图数据高效计算的挑战 ............................................................5
1.3.1图计算的特点 ...............................................................6
1.3.2现状和主要优化方向 .....................................................7
1.4主要贡献 ................................................................................9
1.5本书组织结构 ....................................................................... 11
第 2章相... 查看详情