


定价:79元
印次:1-1
ISBN:9787302705932
出版日期:2025.12.01
印刷日期:2026.01.30
图书责编:赵凯
图书分类:教材
"本书是一本系统论述语音信息处理技术与方法的综合性教材。全书共9章,内容涵盖语音听觉感知与信号处理基础、语音增强、语音识别、语音合成、语音转换、声纹识别、情感语音与语音对话系统等多个关键技术方向。 第1章绪论,介绍了语音信息处理技术的发展历程与分类,并概述了全书的结构安排。 第2章语音听觉感知与信号处理基础,从语音产生机制出发,系统讲解了语音信号的时域、频域及线性预测分析等基本处理方法。 第3章语音增强,主要阐述了单通道语音增强与多通道语音增强方法。 第4章语音识别,主要介绍了语音识别技术的核心原理与典型方法,涵盖从传统混合模型到端到端建模,再到当前前沿的大模型语音识别系统。 第5章语音合成,系统介绍了语音合成技术的基本原理、主要方法及其**进展,从传统拼接式方法到基于大语言模型的端到端合成技术。 第6章语音转换,包括语音转换的基本原理、主要技术及评价方法。 第7章声纹识别,分析了声纹识别的基本原理、主流建模方法、端到端建模技术及其安全性与评价指标。 第8章情感语音,围绕情感的定义、特征提取方法、情感识别模型及其发展趋势进行了探讨。 第9章语音对话系统,介绍了发展历程、关键技术路径以及基于大模型的端到端语音对话系统与评测方法。 本书适合高校学生作为语音信息处理相关课程教材,也可作为从事语音技术研发人员的自学参考书与工程实践指南。 "
前言 语音信息处理融合了语音学、数字信号处理、心理学、计算机科学和模式识别理论等多学科知识,主要涉及语音增强、语音识别与合成、声纹识别与语音对话等关键技术,具有广阔的应用前景,在智能客服、智慧教育、智能家居、医疗健康、安防监控、车载系统及无障碍通信等领域发挥着重要作用,显著提升了人类生活质量、工作效率和社会智能化水平。随着人工智能的迅速发展,语音信息处理技术取得了显著进展,引发了学术界和工业界的广泛关注,推动了多个行业的智能化升级,同时为相关产业链的构建和国家重点应用场景提供了理论和技术保障。 本书系统总结了近年来语音信息处理领域的核心理论和关键方法,内容涵盖基础原理、前沿技术和应用场景,同时展示了该领域的最新研究成果。本书包括九章内容和附录,结构由浅入深、逻辑清晰,语言简洁易懂,帮助读者逐步掌握语音信息处理的核心概念和前沿动态。第1章为绪论,重点介绍语音信息处理的内涵与发展历史。第2章介绍语音听觉感知与信号处理基础,包括语音的物理和声学原理、数字化处理及基频和共振峰估计。第3章深入探讨语音增强,覆盖单通道与多通道的降噪、去混响、回声消除及基于深度学习的增强方法。第4章解析语音识别,介绍混合识别系统的声学和语言模型、解码技术及端到端和自监督预训练模型。第5章介绍语音合成的基本概念,包括文本分析、韵律处理、波形拼接和端到端合成方法。第6章讨论语音转换,涵盖平行与非平行语料的转换方法及其评价标准。第7章详述声纹识别,介绍基于高斯混合模型、神经网络和自监督学习的声纹表征与分类方法,并探讨欺骗攻击防御技术。第8章讲解情感语音,涵盖情感特征提取、建模及识别技术...
第1章绪论
/
1.1语音信息处理技术的发展/
1.2语音信息处理技术的分类/
1.3本书的组织结构/
第2章语音听觉感知与信号处理基础
/
2.1语音产生的生理基础/
2.2语音产生的声学原理/
2.3语音信号的时域分析/
2.4语音信号的频域分析/
2.5语音信号的线性预测分析/
2.6基音周期估计/
2.7共振峰估计/
2.8常用声学特征/
2.9听觉注意力解码/
2.10本章小结/
习题/
参考文献/
第3章语音增强
/
3.1简介/
3.2单通道语音增强/
3.3多通道语音增强/
3.4本章小结/
习题/
参考文献/
第4章语音识别
/
4.1简介/
4.2混合语音识别/
4.3端到端语音识别/
4.4流式端到端语音识别/
4.5基于自监督预训练的语音识别/
4.6基于大模型的语音识别Whisper/
4.7本章小结/
习题/
参考文献/
第5章语音合成
/
5.1简介/
5.2文本分析/
5.3拼接语音合成/
5.4统计参数语音合成/
5.5局部端到端语音合成/
5.6完全端到端语音合成/
5.7基于大语言模型的端到端语音合成/
5.8语音合成评价方法/
5.9本章小结/
习题/
参考文献/
第6章语音转... 查看详情





