数据标注工程(第2版)
链接:https://pan.baidu.com/s/1drtEnRigTQhA3-VySqoT-w 提取码:6666 客服QQ(2577316833) 帮助读者了解数据标注,学习数据标注为宗旨,叙述简明扼要,内容通俗易懂。可以帮助读者快速建立信息,提升技巧。

作者:李彤、刘鹏

丛书名:大数据应用人才培养系列教材

定价:49元

印次:2-5

ISBN:9787302625179

出版日期:2023.01.01

印刷日期:2025.06.30

图书责编:邓艳

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

《数据标注工程(第2版)》由数据标注行业的专家团队编写,采用通俗易懂的方式,系统地介绍了数据标注的基本概念、分类、流程、质量管理、安全、项目管理、平台和应用等内容。本书通过理论与实战相结合的方式,帮助读者由浅入深进行学习,让读者真正掌握数据标注的核心技术、数据标注工程实施和管理方法。

刘鹏教授,清华大学博士毕业,现任南京云创大数据科技股份有限公司总经理,兼任中国大数据应用联盟人工智能专家委员会主任、中国信息协会教育分会人工智能教育专家委员会主任、教育部全国普通高校毕业生就业创业指导委员会委员,第45届世界技能大赛中国区云计算选拔赛裁判长/专家指导组组长,2019年全国大学生数据建模比赛命题人,工信部云计算研究中心专家。主持科研项目40多项,发表论文80余篇,出版专业书籍30多本。出版的《云计算》教材被全国高校广泛采用,名列知网统计的“中国高被引图书”(计算机技术)前三甲。出版的《大数据》《深度学习》《数据挖掘》等教材也受到普遍欢迎。创办的云计算世界(www.chinacloud.cn)和大数据世界(www.thebigdata.cn)等网站在业界有举足轻重的影响。李彤,男,1976年1月生于北京,1998年毕业于北京工业大学,2008年获得北京大学新闻传播专业硕士学位。曾在新浪网就职10余年,先后担任互动中心总监、总编室主任等多个岗位,主要负责新浪网交互栏目内容的审查,保证了整个新浪交互频道的安全、公司信息安全。2014年至今,在北京字节跳动担任中国内容质量与用户体验平台负责人,及各产品内容总编辑,对字节跳动旗下近50个产品内容质量安全工作。

第2 版前言 2022 年8 月12 日,为加快推动人工智能应用,助力稳经济,培育新的经济增长点,根据国务院发布的《新一代人工智能发展规划》,按照科技部等六部门联合印发的《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,科技部印发了《关于支持建设新一代人工智能示范应用场景的通知》,并支持建设首批10 个示范应用场景:智慧农场、智能港口、智能矿山、智能工厂、智慧家居、智能教育、自动驾驶、智能诊疗、智慧法院、智能供应链。 人工智能和信息技术的发展,孕育了人工智能训练师等新兴职业。自2020 年年初人工智能训练师正式成为新职业并纳入国家职业分类目录,人工智能训练师的从业人员增长迅速。该职业包含数据标注员、人工智能算法测试员两个工种。人工智能训练师从概念发展为新职业,只用了四年时间,从业人员也从0 发展到20 万。随着国家政策的大力支持,行业的数字化转型需求,人工智能在各行各业的场景化广泛应用,人工智能已进入产业级大模型时代,人工智能训练师的需求规模将迎来爆发式增长,2022 年全国约需200 万人工智能训练师从业人员。 人工智能技术推动着第四次工业革命,支撑人工智能发展的三大因素分别是数据、算力、算法。数据量级及质量的高低直接影响人工智能的结果输出。要想输入的数据是算法能够识别的数据,就需要把原始数据按照规则进行一定的处理,换成专业名词就是“数据标注”。数据标注的对象有许多类型,如语音、视频、图片、文字等,经过十多年的发展,数据标注 技术逐渐成熟,并已形成数据服务产业。 2022 年1 月,国务院发布《关于印发“十四五”数字经济发展规划的通知》,提到“坚...

目录
荐语
查看详情 查看详情
目 录

第1 章 数据标注概述

1.1 数据标注的起源与发展 1

1.1.1 什么是数据标注 3

1.1.2 数据标注分类概述  4

1.1.3 数据标注流程概述  7

1.2 数据标注的应用案例  8

1.2.1 出行行业  8

1.2.2 金融行业  8

1.2.3 医疗行业  9

1.2.4 家居行业  9

1.2.5 安防行业  9

1.2.6 公共服务  10

1.2.7 电子商务  10

1.3 新职业-人工智能训练师 10

1.3.1 有多少智能,就有多少人工  10

1.3.2 让AI 更懂人类的新职业 11

1.3.3 最后一批人工智能的“老师” 16

1.4 数据越多,智能越好 17

1.5 作业与练习 19

参考文献 19

第2 章 数据采集与清洗

2.1 数据采集  21

2.1.1 数据采集方法  21

2.1.2 数据采集流程  22

2.1.3 标注数据采集案例  24

2.2 数据清洗  26

2.2.1 数据清洗方法  27

2.2.2 数据清洗流程  28

2.2.3 数据清洗的评判 29

2.2.4 数据清洗实例  29

2.3 作业与练习 31

参考文献 31

第3 章 数据标注分类及应用

3.1 图像标注  33

3.1.1 什么是图像标注 33

3.1.2 图像标注任务类型  34

3.1.3 图像标注方式  35

3.1.4 图像标注案例  37

3.2 语音标注  40

3.2.1 什么是语音标注 40

3.2.2 语音标注任务类型  40

3.2... 查看详情

《数据标注工程(第2版)》可作为人工智能训练师专业教材,也可作为大数据和人工智能应用人才的专业教材以及广大数据标注行业从业者的学习资料。 查看详情