语音信号处理以语音为研究对象,涉及心理学、生理学、语言学、人工智能和模式识别等多项研究领域,甚至还涉及到说话时的表情、手势等人的体态语言信息。由于语音是人们在日常生活中的主要交流手段,因此语音信号处理在现代信息社会中占有重要地位。语音信号处理的研究工作最早可以追溯到19世纪70年代,而在20世纪得到了长足的发展,到了20世纪90年代,IBM、Apple、AT&T、NTT等著名公司为语音识别的实用化开发投以巨资,致使语音信号处理技术的应用掀起了热潮。
近年来,随着语音信号处理技术的日益成熟,出现了新的基于语音识别的应用方向,如语音拨号、呼叫中心、移动设备中的嵌入式命令控制、发音学习以及基于关键词检出的口语会话系统等。随着语音信号处理技术在实际生活中的应用的不断发展,语音信号处理技术已经被广泛地接受和使用。由于语音比其他形式的交互方式具有更多的优势,因此这项技术已经越来越贴近人们的生活。目前,语音信号处理技术处于蓬勃发展时期,不断有新的产品被研制开发,市场需求逐渐增加,具有良好的应用前景。
本书不仅让读者对语音信号处理技术的基本理论、方法和典型应用有一个系统的了解,并且将该学科中的一些新的发展动态介绍给读者,使读者在学术思想上受到一些启发。
书中内容涉及作者承担的国家自然科学基金项目的部分研究成果。衷心感谢国家自然科学基金项目(项目号60085001)、教育部跨世纪优秀人才培养计划基金项目的资助,书中包含了这些项目的部分研究成果。
本书从语音信号处理的共性技术出发,首先介绍了预处理、信号数字化以及特征提取技术,然后根据不同的研究方向,分别介绍了语音编码和语音识别等相关技术。内容由浅入深,知识全面、系统。并将一些较新的技术呈现给读者,如目前较受关注的语音信号的非线性产生模型、从时频分析角度考虑的短时分析技术以及语音识别中的关键词检出技术、自适应技术和一些顽健语音识别方法等。
本书的第1、7、9章由哈尔滨工业大学韩纪庆编写,第2、3、6章由黑龙江科技学院张磊编写,第4、5、8章由哈尔滨工业大学郑铁然编写,韩纪庆负责全书的总体安排和审定,郑贵滨为书稿中的插图做了大量的工作,在此表示感谢。
虽然作者从事语音信号处理工作已10余年,积累了大量的语音信号处理的实践经验,但因作者水平有限,时间仓促,文中所述内容难免有不足之处,敬请读者批评指正。