首页 > 图书中心 >图书详情

语音信号处理(第3版)

语音交互是实现人工智能的基石!全面论述语音信号的生成、处理、压缩、传输、合成、识别与理解!清华、中科院、中国计算机学会、百度人工智能专家联袂推荐!

作者:韩纪庆、张磊、郑铁然
定价:89
印次:3-7
ISBN:9787302517603
出版日期:2019.05.01
印刷日期:2024.01.04

本书系统地介绍语音信号处理的基础、概念、原理、方法与应用。全书共分9章。第1章介绍语音信号处理及其发展过程; 第2章介绍语音信号的产生与人类听觉的机理,传统的线性语音产生模型,以及非线性语音产生模型; 第3章从语音信号的时域特征入手,引入时频分析的思想,并进一步阐述时频分析中短时傅里叶变换和小波变换在语音信号特征分析中的应用,最后对广泛使用的倒谱特征以及同态解卷积进行介绍; 第4章介绍语音信号的线性预测原理、解法、几种推演方法以及线谱对分析法; 第5章介绍语音编码的相关知识,包括语音的波形编码、极低速率语音编码技术,以及相关编码器的性能指标和评测方法; 第6章介绍语音识别的基本内容,从基于矢量量化的识别技术到动态时间归正的识别技术,从隐马尔可夫模型技术到基于深度学习的语音识别技术,从孤立词识别到连接词识别及连续语音识别技术,再到关键词检出技术,最后还介绍新兴起的语音识别应用技术,以及用于HMM系统构建的HTK工具和用于深度学习系统构建的Kaldi工具等; 第7章介绍说话人识别的基本内容,从基于GMMUBM的识别技术到基于支持向量机的识别技术,从基于联合因子分析的识别技术到基于ivector的识别技术,以及近年来受到关注的基于深度学习的识别技术等; 第8章介绍顽健语音识别技术,从影响语音识别性能的环境变化因素分析开始,介绍噪声环境下顽健语音识别技术,以及变异语音识别的技术; 第9章介绍语音合成的基本原理、线性预测合成、共振峰合成以及汉语按规则合成,以及基于HMM的合成技术等内容。 本书可作为高等院校计算机应用、信号与信息处理、通信与电子系统等专业及学科的高年级本科生、研究生教材,也可供该领域的科研及工程技术人员参考。

more >

前言 语音信号处理以语音为研究对象,涉及心理学、生理学、语言学、数字信号处理、模式识别、人工智能、机器学习等诸多研究领域,甚至还涉及人说话时的表情、手势等体态语言信息。由于语音是人们日常生活中的主要交流手段,因此语音信号处理在现代信息社会中占有重要地位。 语音信号处理的研究工作最早可以追溯到19世纪70年代,在20世纪得到了长足的发展,并在20世纪90年代,随着IBM、Microsoft、Apple、AT&T、NTT等著名公司为语音识别的实用化开发投以巨资,掀起了语音信号处理技术的应用热潮。进入21世纪,伴随着以深度神经网络为代表的深度学习理论的全面突破、以通用图形处理器(GPU)为代表的硬件技术的迅猛发展,语音识别的性能得到显著提高,从而迎来了语音信号处理技术的蓬勃发展。 目前在语音信号处理领域中不断有新的技术涌现。本书再版的目的就是将这些新的技术融合到已有的相关理论与技术中。全书以语音信号处理过程的总体框架为线索,全面阐述语音信号的前端处理技术、语音编码技术、语音识别和说话人识别技术,以及语音合成技术。相对于上一版,本书补充了基于深度学习的语音识别、基于ivector的说话人识别等本领域的前沿理论和技术,以利于读者充分了解最新的学术发展动态,并能在学术思想上受到启发。同时,书中也介绍了当前深度学习方法中广泛采用的Kaldi工具的使用技巧,以帮助读者掌握相关的实践手段。 本书涉及作者承担的多项国家自然科学基金项目的部分研究成果,在内容上既注重基本理论的系统性,又兼顾实用性和可读性,可作为高等院校计算机应用、信号与信息处理、通信与电子系统等专业及学科的高年级本科生、研究生教材,也可供该领域的科研及工程技术人员参考。 本书的第1、2、4章由韩纪庆编写,第3、6、9章由张磊编写,第5、7、8章由郑铁然编写。韩纪庆负责全书的总体安排和审定。在新版增加的内容中,郑铁然在基于深度学习的语音识别部分、陈晨在说话人识别部分、史秋莹在Kaldi工具部分的撰写上作出了重要贡献。郑贵滨为书稿的完善做了大量工作,在此表示感谢! 本书虽然是作者从事语音信号处理工作30年的理论与实践的结晶,但因作者水平有限、时间仓促,缺点和错误在所难免,敬请读者批评指正,提出宝贵意见。 作者于哈尔滨工业大学2019年1月

more >
扫描二维码
下载APP了解更多

同系列产品more >

智能群体博弈

张春燕、谢广明
定 价:59元

查看详情
自然语言处理原理与实战

陈敬雷
定 价:99元

查看详情
自动驾驶——人工智能理论与实践

胡波主编 林青 陈强副主编
定 价:59元

查看详情
Keras深度学习开发实战

[英] 马修·穆卡姆(Matt
定 价:79元

查看详情
智能科学导论(微课视频版)

史忠植
定 价:69元

查看详情
图书分类全部图书
more >
  • 语音交互是实现人工智能的基石!全面论述语音信号的生成、处理、压缩、传输、合成、识别与理解!清华、中科院、中国计算机学会、百度人工智能专家联袂推荐!
  • 语音交互是实现人工智能的基石!全面论述语音信号的生成、处理、压缩、传输、合成、识别与理解!清华、中科院、中国计算机学会、百度人工智能专家联袂推荐!本书适合作为丛书语音信号处理、音频处理等方向的工程技术人员,高校师生阅读,参考!
more >
  • 目录

    第1章绪论

    1.1语音信号处理的发展

    1.2语音信号处理的应用

    1.3语音信号处理的总体结构

    参考文献

    第2章语音信号的声学基础及产生模型

    2.1语音信号的产生

    2.1.1语音的发音器官

    2.1.2语音的声学特征

    2.1.3语音信号在时域和频域的表示

    2.1.4汉语中语音的分类

    2.1.5汉语语音的韵律特性

    2.2语音信号的感知

    2.2.1听觉系统

    2.2.2听觉特性

    2.2.3掩蔽效应

    2.3语音信号的线性产生模型

    2.3.1激励模型

    2.3.2声道模型

    2.3.3辐射模型

    2.4语音信号的非线性产生模型

    2.4.1调频调幅模型的基本原理

    2.4.2Teager能量算子

    2.4.3能量分离算法

    2.4.4调频调幅模型的应用

    参考文献

    第3章语音信号的特征分析

    3.1语音信号数字化

    3.1.1语音信号的采样和量化

    3.1.2短时加窗处理

    3.2语音信号的时域分析

    3.2.1短时能量分析

    3.2.2短时平均过零率

    3.2.3短时自相关函数和短时平均幅度差函数

    3.2.4端点检测和语音分割

    3.3语音信号的频域分析

    3.3.1滤波器组方法

    3.3.2傅里叶频谱分析

    3.4传统傅里叶变换缺点及时频分析的思想

    3.4.1信号的时频表示

    3.4.2不确定原理

    3.5Gabor变换

    3.6小波变换在...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘