前 言
本书是针对大数据应用部署与调优的“1+X”职业技能等级标准考试培训用教材,主要面向从事大数据应用系统规划、部署、配置、实施、维护、优化升级以及大数据
应用系统监控、管理、资源协调等相关工作的人员。
职业技能分级达标要求分为基础运维、中级运维和高级运维3 个层次。
基础运维:能够熟练掌握数据采集、预处理、存储和处理流程,对大数据的基本处理框架和批流处理技术有初步认识。能够独立完成常规的大数据应用系统分布式环境与应用配置,并能够对常见故障进行基本的识别、判断和处理,满足大数据应用系统日常运维要求。
中级运维:能够对事件管理、故障管理、性能管理、配置管理、日志管理、备份管理等有较全面的认识,能够熟练应用各类管理工具,开展日常巡检工作。初步掌握Linux 操作系统、MySQL 数据库和Python 开发环境的安装部署,学习和掌握Python基本编程语法,学会使用Python 常用的模块功能,满足基础编程和程序调试要求。
高级运维:能够掌握安全管理、加固方法、配置和性能优化、作业调度等技能,
满足业务连续性要求,保证系统长期稳定运行和效率优化提升。同时能够掌握大数据
应用开发的高级技能,熟练使用数据分析、数据可视化的算法和工具,满足深度运维
管理和应用开发调优的要求。
本书的章节内容就是围绕以上3 个层次的要求由浅入深地系统性介绍大数据行业背景、生态,大数据系统和大数据应用的安装部署、日常维护,以及涉及安全管理、性能优化及高可用管理等方面的高级运维,为了进一步提升运维人员面对复杂运维任务的能力,本书还介绍了基于Python 语言的应用基础编程,以及针对大数据应用开发
的要求,通过案例学习数据采集、数据分析和可视化的编程。
第1 章“大数据导论”主要通过对大数据的概念、特征、关键技术和应用场景的介绍,给读者引入必要的领域相关背景知识。
第2 章“基础云架构”介绍了与大数据系统和应用密切相关的基础服务设施云计算的概念,并分别通过OpenStack 和阿里云的相关技术介绍了私有云和公有云的基础知识。
第3 章“大数据业务流程”从大数据应用系统的典型业务流程出发,结合系统管理、数据应用方面带来的挑战,展开介绍了数据采集、数据预处理、大数据存储与处理等相关概念和技术。
第4 章“系统安装部署”介绍了大数据系统和应用安装部署的概念,包括配置文件、用户手册、帮助文档等资源的收集、打包、安装、配置、发布的过程;并通过软件部署、测试、变更、升级等操作,从理论和实践两方面使读者熟悉大数据组件的运
维知识。
针对大数据系统数据量大、机器规模大、分布式架构及并行计算等特点,第5 章“日常维护管理”介绍了大数据系统和应用运行维护与管理所涉及的对象、内容、工具、流程、制度和规范等方面的内容。
第6 章“高级系统运维”展开介绍了安全管理、系统优化以及系统的高可用架构等相关概念,并从实践的角度去扩充介绍了相关的技术实践方案和优化方案。
第7 章“基础应用开发”介绍了Python 的开发环境、Python 背景、Python 基本语法,使读者能够进行基础的应用开发工作。
第8 章“大数据应用开发”从开发流程入手,介绍了数据采集、数据分析和数据可视化的概念,并通过两个综合数据分析和可视化的实际案例,培养数据相关应用的应用开发技能。
本书是编写小组集体智慧的结晶,虽然在大纲确立、资料整理、内容编写及稿件审核过程中反复检查校对,力求内容清晰无误,便于读者学习理解;但疏漏和不完善之处仍在所难免,恳请各位读者批评指正,不吝赐教!
编 者
2022 年3 月