TensorFlow语音识别实战
详解TensorFlow API和ResNet模型,实战语音识别技术

作者:王晓华

丛书名:人工智能技术丛书

定价:69元

印次:1-4

ISBN:9787302584858

出版日期:2021.08.01

印刷日期:2024.01.05

图书责编:夏毓彦

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书使用新的TensorFlow 2作为语音识别的基本框架,引导读者入门并掌握基于深度学习的语音识别基本理论、概念以及实现实际项目。全书内容循序渐进,从搭建环境开始,逐步深入理论、代码及应用实践,是语音识别技术图书的**。 本书分为10章,内容包括语音识别概况与开发环境搭建、TensorFlow和Keras、深度学习的理论基础、卷积层与MNIST实战、TensorFlow Datasets和TensorBoard详解、ResNet模型、使用循环神经网络的语音识别实战、有趣的词嵌入实战、语音识别中的转换器实战、语音汉字转换实战。 本书内容详尽、示例丰富,适合作为语音识别和深度学习初学者必备的参考书,同时非常适合作为高等院校和培训机构人工智能及相关专业师生的参考教材。

王晓华,计算机专业讲师,长期讲授面向对象程序设计、数据结构、Hadoop程序设计等研究生和本科生相关课程;主要研究方向为云计算、数据挖掘。曾主持和参与多项国家和省级科研课题,独立科研项目获省级成果认定,发表过多篇论文,拥有一项国家专利。著有《Spark MLlib机器学习实践》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow 2.0卷积神经网络实战》《TensorFlow+Keras自然语言处理实战》等图书。

前 言 自动语音识别(Automatic Speech Recognition,ASR)简称为语音识别,是目前科学界、互联网界和工业界研究的一大技术热点及重点方向,也是很有前途和广阔发展空间的一大新兴技术领域。语音识别可以看成一种广义的自然语言处理技术,目的是辅助人与人之间、人与机器之间更有效的交流。语音识别目前已经应用在人们生活中的各个方面,常用的有文字转语音、语音转文字等。 随着深度学习在图像处理中获得成功,科研人员尝试使用深度学习解决语音识别的问题,因为这两个领域的相关特征信息都是相对低层次的,可以借助深度学习的强大学习能力学习其中的复杂信息,目前来看这个尝试是成功的,深度学习同样能够帮助语音识别取得长足进步。 本书选用TensorFlow 2.1作为深度学习的框架,从TensorFlow 2的基础语法开始,到使用TensorFlow 2进行深度学习语音识别程序的设计和实战编写,全面介绍使用TensorFlow 2进行语音识别实战的核心技术及其相关知识,内容全面而翔实。 本书并不是一本简单的实战“例题”性图书,本书在讲解和演示实例代码的过程中,对TensorFlow 2的核心内容进行深入分析,重要内容均结合代码进行实战讲解,围绕深度学习基本原理介绍了大量实战案例,读者通过这些案例可以深入地了解和掌握深度学习和TensorFlow 2的相关技术,并对使用深度学习进行语音识别进一步掌握。 本书是一本面向初级和中级读者的优秀教程。通过本书的学习,读者能够掌握使用深度学习进行语音识别的基本技术和在TensorFlow 2框架下使用神经网络的知识要点,掌握从基于深度...

目录
荐语
查看详情 查看详情
目    录

第1章  语音识别之路 1

1.1  何谓语音识别 1

1.2  语音识别为什么难——语音识别的发展历程 2

1.2.1  高斯混合-隐马尔科夫时代 3

1.2.2  循环神经网络-隐马尔科夫时代 4

1.2.3  基于深度学习的端到端语音识别时代 5

1.3  语音识别商业化之路的三个关键节点 5

1.4  语音识别的核心技术与行业发展趋势 7

1.5  搭建环境1:安装Python 8

1.5.1  Anaconda的下载与安装 8

1.5.2  Python编译器PyCharm的安装 11

1.5.3  使用Python计算softmax函数 14

1.6  搭建环境2:安装TensorFlow 2.1 15

1.6.1  安装TensorFlow 2.1的CPU版本 15

1.6.2  安装TensorFlow 2.1的GPU版本 15

1.6.3  练习——Hello TensorFlow 18

1.7  实战——基于特征词的语音唤醒 19

1.7.1  第一步:数据的准备 19

1.7.2  第二步:数据的处理 20

1.7.3  第三步:模型的设计 21

1.7.4  第四步:模型的数据输入方法 22

1.7.5  第五步:模型的训练 24

1.7.6  第六步:模型的结果和展示 25

1.8  本章小结 25

第2章  TensorFlow和Keras 26

2.1  TensorFlow和Keras 26

2.1.1  模型 27

2.1.2  使用Keras API实现鸢尾花分类(顺序模式... 查看详情

使用深度学习进行语音识别是近年来AI研究的热点之一。本书可以帮助读者掌握深度学习的核心内容、TensorFlow实现语音识别的技术要点以及从模型构建到应用程序编写的整套技巧。 查看详情