“有多少智能,就有多少人工”。随着人工智能技术突飞猛进地发展,数据标注行业也随之异军突起。经过短短几年的发展,我国专职从事数据标注行业的人员已经突破20万,兼职人员的数量突破100万。在未来5年,专职数据标注工程师的缺口将高达100万。人工智能行业巨头纷纷寻找专业的数据标注工程师,但目前接受过系统培训的数据标注工程师少之
又少。
早期的数据标注工作是由专门研究人工智能算法的工程师进行小规模的数据标注,但在人工智能第三次浪潮之下,小规模的数据标注已经不能满足人工智能的发展需求,所以在2011年开始出现专门从事数据标注工作的团队,并且慢慢形成了数据标注行业。从2017年开始,人工智能的应用开始呈爆炸式增长,大规模的数据标注需求涌入,让数据标注行业迎来真正的爆发,正式进入人们的视野。
在快速膨胀的需求与国家扶持政策的推动下,全国高职、中职院校纷纷启动数据标注应用型人才培养计划。然而,数据标注专业建设却面临重重困难。首先,数据标注是一个新生事物,懂数据标注的教师少之又少,院校缺“人”;其次,尚未形成完善的数据标注人才培养和课程体系,院校缺“机制”;最后,院校没有数据标注项目,开展数据标注教学实践工作缺“原材料”。
为了能够更系统地培养数据标注工程师,我们的团队经过大量的市场考察与调研,深入了解数据标注行业,对数据标注各个环节进行调查整理,推出了这本教材。本书先从数据标注基本概念开始,介绍数据标注的前世今生以及发展趋势,然后系统地梳理了数据标注分类及数据标注流程,再对数据标注质量检验和数据标注管理进行详细介绍,最后分析学习热门行业数据标注应用,对四大重点行业进行数据标注实战。本书致力于将理论与实践结合在一起,让读者真正掌握数据标注的核心技术。
VIII 数据标注工程
本书是集体智慧的结晶,在此谨向付出辛勤劳动的各位作者致敬!书
中难免会有不当之处,请读者不吝赐教。我的邮箱:gloud@126.com,微信
公众号:刘鹏看未来(lpoutlook)。
刘鹏 教授
于南京大数据研究院
2019 年1 月1 日