关 于 作 者
本书的作者目前工作于德国Karlsruhe大学的AIFB实验室。他们是语义技术和相关领域的著名研究者。他们发表过重要的文献,并且是国际会议、期刊和系列书籍的程序委员会与编辑委员会成员。他们广泛的教学活动包括编写大学讲义、开设夏季课程和高级别会议的开课。3名作者都作为W3C的OWL工作组成员对OWL 2标准做出了贡献。
Pascal Hitzler是AIFB的助理教授,2009年9月作为教学人员加入俄亥俄州德顿的莱特州立大学Kno.e.sis中心。2001年,他在科克大学和爱尔兰国立大学获得数学博士学位。从2001年到2004年,他在德国的德累斯顿技术大学人工智能学院当博士后研究员。在2003年,他花费了三个月的时间在俄亥俄州克利夫兰的凯斯西储大学做助研。他多样的研究兴趣覆盖语义万维网、知识表示和推理、神经-符号集成和计算机科学的形式基础。他是IOS出版社的语义万维网研究(Studies on the Semantic Web)系列书籍的主要编辑者。更多信息,见http://www.pascal-hitzler.de/.
Markus Krotzsch 是AIFB的一名研究员,在这里他正在完成他的博士论文。他在2005年从德累斯顿技术大学计算逻辑国际中心获得他的科学硕士学位。他的研究专注于语义万维网知识表示、实践应用,以及算法和逻辑基础。他是非常成功的语义万维网应用平台Semantic MediaWiki的领导开发者,也是semanticweb.org社区平台的维护者。在开始OWL 2的工作之前,他参加到W3C规则交换格式(RIF)工作组。更多信息,见http://korrekt.org/.
Sebastian Rudolph 是AIFB的助理教授。他在2006年从德累斯顿技术大学代数学院获得数学博士学位。他的活跃研究兴趣包括代数、复杂性理论、逻辑、机器学习、优化、数据库理论和计算语言学。在2009年,他作为访问研究员留在牛津大学计算实验室,在那里他与信息系统组合作。除了他的学术工作,他是一个半职业的古典歌手。更多信息,见 http://sebastian-rudolph.de/. FOREWORD前 言 用于信息搜索,集成与分析的元数据和语义已经有了30多年的实践。概念建模和知识表示,这些能够丰富知识表示并在相关推理时需要的东西,也已经存在有段时间了。但是,随着万维网带来的更大的多样性(异构性)与规模,以及同时出现的语义,万维网技术和与之相伴随的数据增长是不可避免的。在Tim Berners-Lee发明术语语义万维网后的近10年,它变成了一个成长中的、重要的、被公认为跨学科的计算机科学领域。W3C的努力已经导致了被广泛采用的语言标准,这些努力对于数据网的语义技术开发有着很大的贡献,而大量的新成立的公司正在快速地创造基于这些标准的工具、应用、产品和服务。有3个关注于此的主要会议,其中包括最重要的国际语义万维网大会,以及至少20个其他以语义万维网为一个重要子领域的会议,语义万维网已经确确实实成为一个话题。
我在2001年开始讲授一个研究生的语义万维网科学的课程,并从此每年持续都提供这一课程。在这过程中,我用一系列的论文和报告作为我的课程材料。一个重要的原因是这一领域正快速成长并进化,即使是刚讲过的东西在下一次讲授时看起来就过的了。已经有一些书以语义万维网作为书名,但是它们中的大部分只是把文章和论文收集起来,而对于人们可能称之为学科核心的东西关注有限。一些其他的被作为教材的书更关注于语言和语法,而不是基础。既然语义万维网正飞速进入大学和其他一些全球的教育机构的课程,越来越需要优秀的教材可以被用来作为课程或自学的基础。我很高兴推荐这本书来满足这一需求。它可能正满足我自己的需要,刚好覆盖我课程的基本的核心部分,而我可能补充更多的应用和各学科之间的问题,如自然语言处理、学习、统计与数据库技术的需求应用。
这本书在许多方面是唯一的。它包括一个深入的针对语义万维网的所有主要基础语言的讨论,特别地,它提供了详细的底层形式语义的完整讨论,这正是语义万维网努力结果的中心部分。这也是第一本解决了即将到来的W3C建议标准OWL 2与RIF的教材。此外,被覆盖的主题和底层的概念对读者来说也是很容易接受的,这是因为本书把语法和语义清楚地分开讨论,也就是区分了基本需要的知识和高级材料,尽管某些被覆盖的主题具有中等偏高的难度。这本书的作者是著名的研究者,他们是本书主题的教师,以及在德国的Karlsruhe大学的AIFB的语义万维网研究组的成员。他们的教学技巧以及他们对于材料的深刻理解使本书对于基础学生或高级层次学生,相邻领域的研究者,以及在应用领域的感兴趣的参与者来说都能接受。我有信心,这本书会被广泛接受,并为教导大量希望精通这一成长的学科的学生这一目标扮演重要的角色。
Amit Sheth语义Web技术基础前 言FOREWORD译者序 本书最早作为德国Karlsruhe大学高年级本科生或者研究生介绍语义技术的课程教材。2008年由著名的Springer出版社出版德语版本后,受到广泛的关注,之后由CRC出版社出版英文版本。本书的读者将主要是本科生和研究生。另外还包括对语义技术感兴趣的科研人员和企业界的专业人士。本书可以用于语义Web课堂入门教材。在本书出版之前,在国内市场还没有全面覆盖语义Web基础的教材。本书的出现将填补这一空白。
语义Web是一个成熟的技术领域。在近10年间,一些大型研究机构和公司,比如说DARPA和IBM,投入了大量资金研究语义Web技术。很多技术被工业界用于万维网之外的应用领域,比如说数据集成、知识管理和信息系统。粗略的说,语义Web的总体思想是用背景知识来丰富数据,这些背景知识是用本体的形式来表示,所以具有形式化的语义。语义Web的基础是标准化的语言用来对本体建模。这些语言在表示能力、可伸缩性、直观性和语义的硬度上各有不同。在这本书里,我们将要详细介绍这些标准语言。对于每一个语言,均分为两部分介绍,第一部分是用例子来阐明理论知识,介绍复杂的语法,以及给出直观解释。第二部分将详细给出形式化的语法。
本书的翻译和审校由俞勇、漆桂林、王昊奋和刘畅共同完成。其中,俞勇负责前言、第1~2章,漆桂林负责第3~4章,王昊奋负责第5~7章,刘畅负责第8~9章和附录。参加翻译工作的还有刘畅(前言)、刘畅(第1章)、张康(第2章)、徐凯丰(第4章)、陈俊全(第5章)、程小军(第6章)、田远(第7章)、刘畅(第8章)、刘畅(第9章)、刘畅(附录)。参加校对工作的有牛星、田远、孙辛若、张康、刘畅、陈相如、杜金航、潘俊峰等。
本书第1章介绍语义技术的起源,第2章介绍RDF的基础知识,这里会介绍URI、字面量(literal) 、RDF的语法、RDF的高级特征和RDFS的语法。第3章介绍RDF和RDFS的形式语义,这里会介绍RDF的简单解释、RDF-解释和RDFS-解释,而且还会介绍RDF和RDFS的演绎规则。
本书第4章介绍Web本体语言OWL,这里会介绍OWL的语法、OWL的不同种类以及OWL的最新版本OWL 2。第5章介绍OWL的形式语义,这里会介绍描述逻辑、OWL的模型论语义和OWL的自动推理。
本书第6章介绍本体和规则,这里会介绍一阶规则语言datalog、规则和OWL DL的结合和规则的内部交换格式RIF。第7章介绍本体的查询语言,这里会介绍RDF的查询语言SPARQL和OWL DL的合取查询。
本书第8章介绍本体工程,这里会介绍需求分析、本体创建、本体质量保证、本体模块化和本体工具。第九章介绍本体的一些应用。这里会包括数据聚合、语义维基、语义门户、语义元数据、本体在生命科学中的应用和本体用于标准化等。
在本书的翻译过程中,得到了本书的英文版作者们的大力支持。他们向译者提供了全文书稿的最终版本。感谢清华大学出版社的编辑们,他们对本书的草稿提出了很多指导性的意见。感谢他们的辛勤工作,使得本书能够尽快与读者见面。
由于本书所涉及的内容广泛,许多术语目前尚无固定译法,翻译难度相对较大。尽管我们对某些术语进行了推敲,但仍然可能出现词不达意的地方。此外,由于译者水平有限,译文中不当之处也在所难免。我们也真诚地希望同行与读者朋友们不吝赐教。如果您能将您的意见与建议发往yyu@cs.sjtu.edu.cn,我们将不胜感激。
语义Web技术基础译者序介 绍
本书的目标是介绍语义万维网基础技术,并在一定程度上达到其他教材中未达到的细节与深度。这是一本用于大学课程教材的书,也可以用来自学,对于研究员与从业人员也同样适用。它是本书作者在此领域5年的教学经验的基础上完成的。
在这5年中,发生了许多事。语义万维网从一个被大肆宣传的研究主题到几乎被宣布死亡,再成为被主要IT公司投资的领域。现在它不仅仅是存在着,它正真正的快速发展着,并被来自于研究机构和公司的重要基金所支持着。IT与风险投资公司正在进行投资。多个大规模应用已经被建立起来,而且更多的正在被开发。
与此同时,语义万维网技术依然在快速发展着。没有教材能够紧随最近开发的速度,实际上所有尝试这样做的教材都注定在它们出现时就已经过时了。我们在本书中用一种不同的方法。我们关注于已经建立起的基础,它们在经过一段时间之后已经成为相对稳定的部分,而我们努力去彻底覆盖到这些主题。本书不仅包括基本的介绍和直觉,也有技术细节和形式基础。特别的,在我们看来,本书高级的方面没有被目前任何可用的英文教材足够的讨论非常奇怪的是许多语义万维网教材试图处理语义技术而不是对它们的语义的细节进行解释--因此忽略了这一领域的真正核心。。我们有信心读者可以从本书增强的深度中获益,哪怕仅仅是依赖于我们的直观解释而没有细致地学习高级资料。
因此在本书中,我们传授了基础。但是这些基础是什么呢?语义万维网的基本想法是通过一种可以被计算机解释的方式来描述万维网内容的含义(如语义)。程序可以利用(更多)人类知识来处理任务,允许更多强大的不仅仅存在于万维网上的应用。为了达到这一目的,第一步就是把知识转化为一种机器可处理的形式。得到的描述通常被称为本体,而它们所基于的机器可读的形式被称为本体语言。因此本书的一个主要目标是去细致并深入的覆盖本体语言--为了这一目,显然我们要关注被世界万维网组织标准化的语言。在此基础之上,我们可以考虑评估,查询,以及进一步的丰富本体信息的方法。这已经包含了一些高级的主题,它们还没有稳定。最终,我们也考虑一些明显超出基础的主题,即工具,应用,以及工程方面。我们对于这些快速发展的领域的概述不是确定性的,但是它提供了许多方向,有助于在实践中使用语义万维网技术。快 速 导 读
为了更好地理解本书的内容,在介绍语义万维网技术时,我们已经仔细地区分了基本的资料与高级内容。 基本内容的章节提供了一个对于给定技术的周全的首次介绍,包括直观解释和许多为了解大部分实践应用的足够的技术细节。高级部分对于那些要深入理解的主题提供了一个细致的见解。初次接触语义万维网技术的读者在第一次阅读时可以简单的略过高级资料。下图提供了一个本书各部分的概览,并粗略地概述了它们之间的关系:第1、2、4章以及7.1节提供了基本资料。更高级的内容在第3、5、6章以及7.2节中提供。第8与第9章关注于应用主题,它们与具体技术的描述基本是独立的。之后会给出每章的内容的概述和更细致的阅读建议。
每章的最后是参考文献,用于进一步的深入阅读并提供原始出版物。每个技术章节提供了一组章节中资料的练习,用于课程作业或帮助自学的读者来记忆内容。所有练习的解答在附录D中给出。其他的附录提供了书中所使用的技术的重要背景信息。下面再一次给出具体的概述。
在本书最后给出的一个完整的索引会有助于快速的查找定义。它包括所有在全书中用到的相关的符号和所有的语法标识符和关键字。
章节概述
即每个章节内容和重要性的简要概述。语义Web技术基础快速导读 第1章 介绍语义万维网技术背后本质的动机和想法。它展示了各种不同的科技的发展如何影响了今天的语义万维网技术。它也简要解释了一些重要的符号和术语--包括“本体”和“语义万维网”--它们会在随后章节中出现。
第2章 介绍了资源描述框架(RDF)的语法和内在的直观解释,以及它的扩展RDF模式。这两者都是在语义万维网上表达(元)数据的基础技术。
第3章 通过深入解释RDF和RDF模式的形式语义,详述其形式基础。这也包括一个对于形式语义的想法和动机的一般性介绍。这一高级资料可以在第一次阅读时被略过,因为在第2章中提供的直观解释对于基本理解RDF(S)来说已经足够了。
第4章 介绍万维网本体语言OWL的语法和内在的直观解释,包括即将到来的修订版OWL 2. OWL提供了为语义万维网表达知识的更多高级的概念。
第5章 通过深入解释OWL与一阶谓词逻辑和描述逻辑的关系,覆盖OWL的形式基础。这一章也包含了一个详细的OWL的自动推理的算法的讨论。这章包含一些高级资料,可以在初次阅读时被略过。
第6章 讨论规则和规则语言,特别是可以用来与之前章节讨论过的语义万维网技术结合使用的部分。这一高级资料还没有被任何标准所覆盖--即将到来的规则变换格式RIF被期待来填补这一空白。就我们所知,本书是第一本提供对RIF介绍的教材。
第7章 讨论语义万维网的查询语言。值得强调的是,这一章包含一个对于SPARQL协议与RDF查询语言的深入的讨论。它也包含一个针对OWL的合取查询的介绍,这在第一次阅读时可以略过。
第8章 讨论本体工程的各个方面--一个目前依然在快速发展着的领域。这章给出一个本体工程方法的概述,并介绍了建模准则,质量保证的方法,和一些支持本体开发的工具。
第9章 给出关于一些现今可以找到的语义万维网技术的突出的应用的概述。我们尽量不再写一份关于可能应用领域和场景的选集,而是关注于在今天已经被实现了的各种应用例子。
在附录中我们提供对于背景知识的简要的说明,这对理解本书中的内容是需要的或有帮助的。我们建议仅在需要时参考相应内容,如一个对于XML或一阶逻辑的简单介绍。附录A讲述了XML与XML模式。附录B列出了集合论中的基本符号。附录C中重述了一阶谓词逻辑基础。附录D提供了对于书中相应章节的所有练习的解答。
本书用于自学
上图提供了一个基本的关于本书中章节之间依赖关系的概述。这是一个粗略的参考:单独的节可能还是会需要较早部分的知识--如6.4.5节也需要第3章的知识--但是如果某些章节不依赖于前面的章节,那么相应的章节可以被略过。
具有必备知识的读者可以跳过基本的章节:如果特定的符号或术语不清,在本书最后提供的索引可以提供一个查找更多信息的简单方法。我们已经努力去使本书中的各章尽可能的独立。例如,尽管在第4章中正式使用在第2章中介绍的RDF,我们不需要详细阅读RDF章节来理解第4章的内容。
以下是某些典型的读者观点和一些阅读建议:
为了完整的介绍这个领域,当然可以从头读到尾。为了简单一点,第3、5和6章等高级章节可以在第一次阅读的时候被略过,而在之后需要更深入理解时再返回阅读它们。
为了学习RDF,读者应该学习第2章和(可选择性的阅读)第3章,还有第7.1节。规则可能是一个有趣的附加内容:在6.1与 6.2节,以及6.4节中与RDF相关的部分提供了一个好的介绍。
为了学习OWL,读者应该学习第4、5章与第7.2节。此外,许多OWL相关的工程方面的提示在第8章中给出。规则可能是一个有趣的附加内容:第6章中的大部分内容都与OWL相关。
已经具有语义技术相关知识的读者应该随意选择相关章节来加深他们的理解。特别地,高级资料可以在第3、5、6章找到,包括一些在其他地方以连贯的教材方式提到的最近的发展。
关于语义技术的快速参考通过索引提供,它包括几乎每个出现在任何讨论的技术中的语法元素和关键字。这对于那些需要快速得到核心定义的从业者来说特别有用。
本书用于教学
有多种方法来使用本书作为讲授语义万维网技术的基础。我们关于内容的选择和组织事实上被我们自己在讲授这一主题时的经验所深深影响。一般的,对于自学的依赖性与准则也适用于计划大学课程。以下是一些典型的选择:
关于语义技术的完整概述 对于一个包含全部语义技术的课程,把所有基本的实用的章节按顺序去讨论是明智的,连同选择第3、5和6章等高级章节的一些方面也被认为是合适的。加入关于XML的章节(附录A)通常是个好主意,而且,如果包含形式语义,简要的介绍一阶逻辑(附录C)也是如此。教师可以随意引入更多的相关主题,如,提供关于XML的更多细节,或包含规则语言与逻辑编程的内容。
我们已经积累了很不错的经验,把这种方案应用于研究生与高年级本科生的一学期课程(15节课每节90分钟,两周一次的辅导课)。在这种情况下的教学大纲是:介绍(第1章); XML基础(附录A) ; RDF与RDF模式(两节课,第2章);形式语义与一阶逻辑的重述要点(附录C) ; RDF(S)语义(第3章); OWL(两节课,第4章); OWL语义(第5章); SPARQL与它的语义(两节课,第7.1节);查询OWL(第7.2节); OWL与规则(两节课,第6章);应用概述(第9章)。这是一个非常紧凑的教学大纲,可以很容易地被扩展为更多的课时,特别是包含更多资料的时候。
对于语义万维网的实用课程 为了给出语义万维网技术和它们的应用的基础的概述,人们可以关注于第2章(RDF) ,第4章(OWL) ,第7章(SPARQL) ,第8章(工程)与第9章(应用)。如果可能,这可以与动手练习相结合,如,一些免费可用的本体编辑器如Protégé(见8.5.1节)。这种方法也适用于一周教程。另一个可行的选择是把这些资料作为一个已经覆盖了XML或网络技术更多细节的课程的一部分来教授。
万维网上的知识表示与推理 如果读者已经熟悉了知识表示与推理的基础方面,讲授语义技术的一些现代应用是明智的。在这种情况下,人们可能希望略过一些技术的和语法的细节,如第2章、第4章,而关注于第3章(RDFS语义,可选),第5章(描述逻辑),第6章(规则),和第7章(SPARQL可以被省略)中的语义和证明理论的内容。这一教学大纲可以被扩展为包括来自逻辑编程,演绎数据库,或模态逻辑的高级资源,这取决于教学者的偏好。
在研讨会中使用本书学生可以自学本书来准备研讨会报告。因为每个章节都是相对独立的,可以很容易地并行准备各章节,而不必依赖于太多之前资料或同学报告的质量。依赖图与之前给出的划分内容为独立课时的建议是选择题目的一个好准则。
以上覆盖了一些典型的基于本书的教学方法。此外,在课程中可以基于相关资料包括选择的单独主题,如,在讨论网络技术、标记、建模语义或知识表示的时候。我们也已经在课程中使用一些关注于更多的应用和与语义万维网相关的研究主题的资料。除了关于本体建模与质量分析(第8章)和OWL的推理算法(第5章)的详细讨论,这些课程也包含语义搜索,(语义)网络服务,应用和对于语义技术的用户接口方面的资料,以及关于OWL推理和它与规则的结合的高级主题。一些合适的文献的指针可以在每章最后找到。对于这一有趣的研究领域的更多的主题,请见\和每年的国际语义万维网大会,世界万维网大会的语义万维网分会,以及一些其他核心的语义万维网研究的宣传事件的会议论文集。
在以上的所有情况中,第1章中的材料是一个介绍语义技术及其背后的基本动机的很好的基础,它也强调了大部分与读者相关的方面。
附加的在线资源
与本书有关的网站:
http://www.semantic-web-book.org/
在那里我们提供了更新、纠错、教学幻灯片和更多资源的链接。欢迎反馈,提问,或改进的建议--可以将它们发送到邮件地址 authors@semantic-web-book.org.
Karlsurhe,德国
Pascal Hitzler
Markus Krtzsch
Sebastian Rudolph致 谢
对于所有使本书出现成为可能的人们致谢几乎是不可能。语义万维网在研究、教学与实践中取得成功这一事实必需归功于不断增加的在这一领域中研究员与从业者的不断努力,他们中的许多人我们跟我们有私交,而且经常在国际会议上见面。他们卓越的工作是本书的基础。
感谢Taylor&Francis的Randi Cohen,她为本书的出现提供了支持。
感谢使用本书作为教材的学生,他们提出了有建设性的反馈。
感谢我们在Karlsruhe大学AIFBhttp://www.aifb.uni-karlsruhe.de/Forschungsgruppen/WBS/english/和KSRIhttp://www.ksri.uni-karlsruhe.de/的同事,在Karlsruhe 的FZI Forschungszentrum Informatikhttp://www.fzi.de/ipe/的同事,以及在ontoprise GmbH的同事,在研究并设计语义万维网的基础时与他们的合作是非常愉快的并且非常多产的。这些合作的核心是Rudi Studer,他像往常一样总是为我们提供一个非常理想的工作环境。
非常感谢Ian Horrocks为本书的早期版本提供一个非常完全的检查,这帮助我们改善了表达并去掉了一些错误。感谢Michael Kifer、Ora Lassila、Uli Sattler、Steffen Staab、Johanna Vlker和Denny Vrandecˇic',他们对本书所覆盖的特定主题进行讨论并提出深刻的见解。
感谢W3C OWL工作组的参与者--在组内对于工作或者围绕工作的活跃的讨论帮助我们加深对于语言的理解。
感谢Gerhard Brewka、Frithjof Dau、Matthias Knorr和Stefan Schlobach,他们为我们关于这一主题的德语书http://www.semantic-web-grundlagen.de/提供了详细的反馈。我们也非常感谢下列人员,他们提供给我们的错误和错别字的报告:Martin Becker、Philipp Cimiano、Fabian David Leuchtner、Margrita Kascha-Bader、Alexander Kirk、Martin Knechtel、Thomas Krekeler、Serge Linckels、Stefan Wiegreffe、Andreas Wülfing.
我们还要感谢所有应该在此提及但忘记被包括在列表中的人。我们承担所有剩余错误的责任。