图书前言

前 言

SAP 这个名字大家都已经熟悉,提起它我们首先想到的是ERP、企业级应用、企业管理解决方案等。的确,SAP 一直基于领先的技术、各行各业丰富的实践经验以及优质的服务,帮助各行业不同规模的企业实现卓越的运营和管理。从企业后台到公司决策层,从工厂仓库到商铺店面,从电脑桌面到移动终端,SAP 助力用户和企业高效协作,获取商业洞察力,并从竞争中脱颖而出。SAP 的软件和服务能够帮助客户实现盈利性的运营,不断提升应变能力,实现可持续的增长。

自从1972 年SAP 成立以来,SAP 一直专注于企业应用和管理,有了自己独特的最佳实践和服务理念。而IT 技术几十年的不断发展,也促使企业应用更加开放、具有多样性,从而使其更加适合当今最新的IT 技术,例如大数据、云计算和实时分析等。2007 年开始,SAP 并购了一系列业界领先的公司,容纳更广阔的IT 技术于企业应用之中,并加强在IT 基础架构、数据分析、企业移动化等诸多领域的研发及应用。

从2012 年开始,SAP 把创新分为了五大市场,分别是企业应用、商务分析、企业移动化、数据管理与技术平台和云计算等。在这五大市场中,企业应用是SAP一贯坚持的方向,而其他四个方面则是适应当今IT 技术的发展而发展起来的。例如,自从2010 年SAP 收购Sybase 公司以后,SAP 采用Sybase 移动化解决方案,使得移动化应用无处不在,我们可以在恰当的时间、适当的地点,通过移动应用随时随地发送和接收信息,完成工作上的要求。通过提供移动销售、移动工作流等系统级移动应用,方便地拓展了企业ERP 和CRM 的使用,延伸了企业应用的范围,提高了工作效率和水平。再譬如,随着SuccessFactors 和Ariba 加入SAP 大家庭,以云计算为核心的企业应用不断涌现,企业可以用全新的方式来运营,而不必遵循传统的管理方式。SAP 完全可以通过托管、租赁等不同的方式,把优质和创新的应用交付给不同规模的企业,尤其是成长型企业,为其部署在云端的解决方案,为广大

成长型企业用户带来适合自己需求的最佳实践。

自2012 年以来,大数据风潮不断升温,人们开始逐渐接受大数据的各种理念和思维。不管是以我们常说的4 个“V”(Volume, Velocity, Variety and Value)来诠释大数据的特征,还是以SAP 视角的4 个“A”(Acquire, Accelerate, Analyze and Act)来看待大数据,我们都不能简单将大数据归结为“数据量大、类型多”这么简单,虽然海量数据是大数据的一个特征,但仅有海量数据还远远不够。其实大数据是指对海量数据进行智慧分析并且预测结果的行为和思维方式。以2012 年的互联网信息为例,全世界每天有超过2940 亿封电子邮件发出,如果采用过去寄信的方式,需要美国邮政局处理两年;每天有200 万篇博客发表,2.5 亿张照片上传到Facebook;每天有86.4 万小时的视频上传到YouTube,如果连续播放这些视频,需要770 年;这样一天互联网上的信息量,足够装满1.86 亿张DVD 光盘。《大数据时代》的作者舍恩伯格说,数据量在过去25 年当中急剧增长,所以就形成了现在的数据雪崩。

现在有人提出数据宇宙的概念,据有关方面预测,从现在到2020 年,数据宇宙将每两年翻一倍,到2020 年,全球的数据量将达到40ZB。这么大的数据量,这么快的数据膨胀,那么大数据起到什么作用,大数据要义是什么呢?《大数据时代》作者舍恩伯格说,大数据与我们传统的思维方式不一样,我们过去追求的是因果关系,追求的是“为什么”,大数据时代的最大转变就是放弃对因果关系的渴求,而关注相关关系。也就是说我们只需要知道“是什么”,而不需要知道“为什么”。比如,美国沃尔玛是世界上最大的零售商,拥有超过200 万员工,销售额超过4500 亿美元。沃尔玛对历史交易数据库进行分析时发现,每当在季节性飓风来临之前,不仅手电筒销售量增加了,同时蛋挞的销量也增加了。从因果关系来讲,手电筒销售量增加是合理的,但是为什么蛋挞也会增加呢?有些人就百思不得其解。但沃尔玛只需要知道消费者买手电筒就会买蛋挞这种相关关系就足够了。所以一旦发生飓风,沃尔玛就把手电筒和蛋挞摆在明显位置上一起销售来增加其销售额。这就是典型的大数据应用。

在SAP 五大市场中,前面已经提到三个,现在说说商务分析和数据管理,这也是大数据最基本的要素之一。如何对大量数据进行存储和管理,如何为商务分析和智慧分析做好准备和前提,这也是SAP 想做的事情。2007 年SAP 收购BusinessObject 公司,在商务智能、信息管理、企业绩效以及治理、风险管理及合规等方面有了自己完整的解决方案。采用SAP 商务分析系列解决方案,企业可获得更为广泛的洞察力,可以优化决策流程,改善风险管理等,同时让企业把对业务的洞察力转化为策略,再转化为运营决策。另外,SAP 商务分析解决方案既能支持传统ERP 系统中的数据分析,也能支持大数据的智慧分析。

数据管理中能够起到大数据作用的,还是要提到今天的主角——SAP Sybase IQ。SAP Sybase IQ 原是Sybase 公司重要的数据仓库和数据集市方面的产品,也是构成大数据的基础平台之一。Sybase IQ 是业界第一个商用的列式数据库,自从1995 年发布以来,Sybase IQ 不断发展,列式数据库也像雨后春笋般不断涌现,例如HP Vertica、InfiniDB、MonetDB、Infobright、GBase 等,直到今天,很多人已经认为只要是做分析型查询应用,非列式数据库不可。原来数据按行存放,现在把数据按列存放,这对于统计分析型查询的确有它自己独特的地方。例如,由于是按列存放,当有一条具体查询语句时,这条查询语句不会涉及数据库二维表中所有的列,只有与查询有关的几列会调入内存参与运算;相比行式存放时,全部列要调入内存相比,会节省大量的磁盘I/O,加快统计查询的时间。另外,由于每列的数据类型一样,可以马上联想到数据压缩,而且压缩比会很大,等等。这些SAP Sybase IQ 的好处,会在您阅读此书时逐渐在眼前展开。SAP Sybase IQ 的最新版本也支持大数据和云计算的特征,例如,建立一套API,允许应用程序员在SAP Sybase IQ 服务器内部建立和发布C++库,在此框架上,可以开发和发布MapReduce 程序,用以分析结构化、半结构化和非结构化的大量数据集,SQL 可以调用C++ Map 和Reduce 算法,并在SAP Sybase IQ 的PlexQ

网格架构中自动进行分布和并行计算等。另外,你可以通过4 种不同的技术,把基于Hadoop 的分析结果集成到SAP Sybase IQ 中去。这样可以从Hadoop 海量数据中标识出有关数据点,然后与在SAP Sybase IQ 中的从其他数据源得到的操作型数据一起分析,找到你想要的结果。

总之,SAP Sybase IQ 是一个经典,是开创列式数据存储的先锋。我们学习SAP Sybase IQ 不仅仅是在创新的技术方面,更要灵活和善用这些技术,最大限度满足业务需求,发挥出这些技术优势,多为企业的运营和决策提供实时、高效和可靠的数据,让数据说话,科学管理,使企业能够健康长久地成长。

宋一平

SAP 中国数据管理技术首席架构师