图书前言

第2 版前言

2022 年8 月12 日,为加快推动人工智能应用,助力稳经济,培育新的经济增长点,根据国务院发布的《新一代人工智能发展规划》,按照科技部等六部门联合印发的《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,科技部印发了《关于支持建设新一代人工智能示范应用场景的通知》,并支持建设首批10 个示范应用场景:智慧农场、智能港口、智能矿山、智能工厂、智慧家居、智能教育、自动驾驶、智能诊疗、智慧法院、智能供应链。

人工智能和信息技术的发展,孕育了人工智能训练师等新兴职业。自2020 年年初人工智能训练师正式成为新职业并纳入国家职业分类目录,人工智能训练师的从业人员增长迅速。该职业包含数据标注员、人工智能算法测试员两个工种。人工智能训练师从概念发展为新职业,只用了四年时间,从业人员也从0 发展到20 万。随着国家政策的大力支持,行业的数字化转型需求,人工智能在各行各业的场景化广泛应用,人工智能已进入产业级大模型时代,人工智能训练师的需求规模将迎来爆发式增长,2022 年全国约需200 万人工智能训练师从业人员。

人工智能技术推动着第四次工业革命,支撑人工智能发展的三大因素分别是数据、算力、算法。数据量级及质量的高低直接影响人工智能的结果输出。要想输入的数据是算法能够识别的数据,就需要把原始数据按照规则进行一定的处理,换成专业名词就是“数据标注”。数据标注的对象有许多类型,如语音、视频、图片、文字等,经过十多年的发展,数据标注

技术逐渐成熟,并已形成数据服务产业。

2022 年1 月,国务院发布《关于印发“十四五”数字经济发展规划的通知》,提到“坚持以数字化发展为导向,充分发挥我国海量数据、广阔市场空间和丰富应用场景优势,充分释放数据要素价值”,并在发展规划保障措施中提到“提升全民数字素养和技能。”“加强职业院校(含技工院校)数字技术技能类人才培养,深化数字经济领域新工科、新文科建设,支持企业与院校共建一批现代产业学院、联合实验室、实习基地等,发展订单制、现代学徒制等多元化人才培养模式。”以大数据为基础的相关数据服务产业也亟待与高校开展深入合作,进一步推动产教融合、校企合作。

为了更好地培养人工智能训练师,提升数据标注领域人才的技术技能,结合我司多年行业实战经验,特联合教育领域专家共同编写本教材。本书共8 章,分别为数据标注概述、数据采集与清洗、数据标注分类及应用、数据标注流程及管理、数据标注质量管理、数据标注进度管理、数据标注平台、数据标注实战,不仅能够作为行业专业人士了解数据标注的入门书籍,还可以作为高等院校开设数据标注实训类课程的指导教材。

本书在编写过程中难免会有不当之处,请各位读者多提宝贵意见。让我们共同为人工智能行业的发展贡献力量!

李 彤

于北京

2022 年9 月1 日