第 1 章 AI 算法的基础—数据
1.1 科学研究的两种方法
1.2 深度学习技术也离不开对数据的观察
1.3 一个通过数据观察和分析的 AI 算法技术创新案例
1.4 数据问题导致的算法或项目失败案例
1.4.1 忽视数据误差
1.4.2 忽视数据特点
1.4.3 忽视人工标注数据的不可靠性
1.5 如何选择合适的算法
1.6 数据是推进人工智能技术发展的“燃料”
第 2 章 培养对数据的敏锐观察力
2.1 心中有“数”
2.2 数据理解力
2.3 实践经验积累
2.4 数据的复杂性
2.5 培养创新意识
2.6 两种思维模式
2.7 观察数据实现算法的案例
2.7.1 算法设计需求—检测电路板中的污渍
2.7.2 观察数据
2.7.3 算法设计
第 3 章 所有的努力都是为了提升概率—漫谈数据分析方法
3.1 AI 系统的可靠性是个概率问题
3.2 呈高斯分布的数据
3.3 高斯分布与聚类分析
3.4 分析数据间的关系—相关性分析
3.5 数据频域分析—如何理解傅里叶变换
3.5.1 卷积
3.5.2 复数
3.6 图像数据分析
3.6.1 分析图像数据的格式
3.6.2 分析图像数据来源
3.6.3 分析图像数据的生成场景
3.6.4 结合图像识别需求分析图像数据的特点
3.6.5 分析生成识别模型所需要的训练图像数量
3.7 自然语言数据分析要领
3.7.1 分析要处理的自然语言包含的语言种类
3.7.2 分析文本数据涉及的场景类型
3.7.3 分析文本数据的字符编码
3.7.4 分析文本数据的大小
3.7.5 结合需求分析文本数据的特点
3.7.6 分析建立自然语言处理模型需要的数据量
3.8 一个充分分析文字数据特点实现算法设计的案例—数学相似题判断方法
第4章 高维空间中的数据
4.1 高维灾难
4.2 高维空间数据分布特点
4.2.1 稀疏性
4.2.2 高维空间数据趋于表面分布
4.2.3 高维空间向量近似正交
4.3 高维空间难题的解决方法
4.4 高维空间数学理论应用案例
4.4.1 JL 引理.
116
4.4.2 压缩感知
4.4.3 利用随机投影获取图像特征
4.4.4 利用随机投影获取到的特征值进行运动物体跟踪的方法
第5章 数据之间存在千丝万缕的联系
5.1 上下文关系
5.2 知识图谱
5.3 事件图谱
5.4 事件图谱应用案例
5.4.1 大数据能做什么
5.4.2 教学活动过程中的事件本体设计
5.4.3 教学活动过程大数据系统框架
5.4.4 教学过程中的事件图谱应用
第6章 让机器学会说话
6.1 语言的起源
6.1.1 不是只有人类才拥有“语言”
6.1.2 人类语言的形成过程
6.1.3 文字的产生
6.2 汉语和英语的语言差异
6.2.1 词语
6.2.2 语法
6.3 Transformer 模型
6.3.1 人工神经网络
6.3.2 Transformer 模型技术原理.
195
6.4 殊途同归 . 201
6.4.1 智能涌现202
6.4.2 思维的机制202
6.4.3 人工智能“十问”206
后记 208