图书前言

语音信号处理以语音为研究对象,涉及模式识别、心理学、生理学、语言学、人工智能、模式识别等多项研究领域,甚至还涉及说话时表情、手势等人的体态语言信息。由于语音是人们在日常生活中的主要交流手段,因此语音信号处理在现代信息社会中占有重要地位。语音信号处理的研究工作最早可以追溯到19世纪70年代,在20世纪得到了长足的发展,并在20世纪90年代,随着IBM、Apple、AT&T、NTT等著名公司为语音识别的实用化开发投以巨资,语音信号处理技术的应用掀起了热潮。

  近年来,随着语音信号处理技术的日益成熟,出现了新的基于语音识别的应用方向,如语音拨号、呼叫中心、移动设备中的嵌入式命令控制、发音学习,以及基于关键词检出的口语会话系统等。随着语音信号处理技术在实际生活中的应用,它已经被广泛地接受和使用。由于语音比其他形式的交互方式具有更多的优势,因此这项技术已经越来越贴近人们的生活。目前,语音信号处理技术处于蓬勃发展时期,不断有新的产品被研制开发,市场需求逐渐增加,具有良好的应用前景。同时,本领域不断出现一些新的技术,如HTK的使用、语音识别的Lattice结构、语言学模型的自适应技术、基于HMM的语音合成技术、开集说话人识别中拒识的处理、最新的基于听觉的音频编码技术等,本书再版的目的是将这些新的技术融合到原来的语音信号处理中,将该学科一些新的发展动态介绍给读者,希望读者在学术思想上受到一些启发。

  本书的内容涉及作者承担的国家自然科学基金项目的部分研究成果。可作为高等院校计算机应用、信号与信息处理、通信与电子系统等专业及学科的高年级本科生、研究生教材,也可供该领域的科研及工程技术人员参考。

  本书的第1、2、4章由韩纪庆编写,第3、6、9章由张磊编写,第4、5、8章由郑铁然编写。韩纪庆负责全书的总体安排和审定。郑贵滨为书稿中的插图做了大量工作,在此表示感谢。

  本书虽然是作者从事语音信号处理工作多年的理论与实践的结晶,但因作者水平有限、时间仓促,缺点和错误在所难免,敬请读者批评指正,提出宝贵意见。

 作者于哈尔滨工业大学2013年1月