由于目前尚无说话人识别的标准数据库,本实验所用的语音数据均在普通实验室环境下,采用Sound-blaster16声霸卡和耳机自带话筒录音采集,录音软件为Sonic Foundry Sound Forge6.0。录制了15个人(包括10男,5女),5秒钟的语音。本实验的采样频率为11025HZ,量化值为16bit。录音数据按帧长256点,帧移为128点,预加重为
,加汉宁窗逐帧提取语音特征。所用的语音特征是第2节中提取的语音特征进行不同的组合所得到的特征组合。
4.2 文本相关说话人辨认系统的实现
,加汉宁窗逐帧提取语音特征。所用的语音特征是第2节中提取的语音特征进行不同的组合所得到的特征组合。
本系统采用动态时间规整方法作为文本相关的说话人识别方法,其识别流程图如图2所示,其中 和 分别为拒绝门限和接受门限。实验都是采用MATLAB6.5作为开发环境,分别针对不同的特征矢量组合做了三类实验。说话人辨认系统的目的是利用机器自动辨认出待识别的语音是来自待考察的人员中的哪一个,判断待识别语音所属的说话人的身份。
实验一:每人每遍说相同内容的一段5秒内的语句,语音材料为朗读报刊杂志中的一到两句话,共录制4遍,不同的人说不同的语音内容。先分别单独使用提取出的语音特征作为特征矢量用DTW算法进行识别,而后将其组合成不同的组合特征矢量进行识别,以正识率为评价标准。
实验二:每人每遍说相同内容的一段5秒内的语句,语音材料为朗读报刊杂志中的一到两句话,共录制4遍,不同的人有说相同的语音内容。
实验三:每人每遍说不同内容的一段5秒内的语句,语音材料为朗读报刊杂志中的一到两句话,共录制4遍,不同的人有说相同的语音内容。
4.3 实验结果及分析
表1 说话人辨认系统中不同语音特征的比较识别结果

通过以上三个实验,其所得的结果如上表1所示。由表1所示的实验结果可以看出,单独使用说话人的语音特征所得的识别结果不如组合使用时的效果好。而在组合使用特征时,MFCC及△MFCC同P及△P组合和LPCC及△LPCC与P及△P的组合,收到的效果最好。这是因为美尔倒谱参数MFCC充分利用了人耳感知系统特性计算出来的特征参数,符合人耳听觉特性,并且能很好的反映语音内容;同时基音周期P描述了说话人个性语音中最基本的信息,而△MFCC和△P则分别是反映了人耳听觉特性的动态特征和基音周期变化的动态特征,这样将说话人语音的静态特征与动态特征相互组合进行文本相关的说话人辨认,效果最为理想。而LPCC及 LPCC与P及 P的组合特征,是结合了反映说话人声道的静态及动态特性的线性预测倒谱及其差分与基音周期的动静态特征,同样在说话人辨认实验中达到了理想的识别结果。
本实验还利用了短时谱分析得到的短时谱临界带特征矢量同P及△P进行组合。在辨认系统中也得到了较好的效果,正识率达到了93.3%。而子带能量倒谱的效果并不如理想中好,原因可能是子带的分段数过少,提取过程还不够精确。
由辨认实验三可以看出,当说话人在参考模板和测试模板中说不同内容的语音时,各种特征组合所得到的识别结果都不理想,说明用动态时间规整算法进行文本无关的说话人识别,效果并不理想。
同时,我们发现当拒绝门限或接受门限设得过高时都会使错误接受率降低,但这样就增高了错误拒绝率,这对于安全系数要求不高的场所(例如,大量使用者利用电话访问公共数据库)会造成用户的不满。因此应该根据不同的使用场合设定门限值。而说话人辨认系统的识别率不仅与门限设置有关,还与识别的人数多少有关,人数越多,识别率越低,所用的计算时间也逐渐增长。
5 结束语
由上面所得的实验结果可以证明,利用改进的多门限多判决DTW法作为说话人识别方法,在一定程度上提高了说话人识别系统的识别率。并且利用多种语音特征组合作为识别的特征矢量时,也获得了较好的识别效果。找出了几种具有较高识别率的特征组合,为进一步研究说话人识别方法提供了更多的语音特征组合方案。
参考文献
[1] 赵力.语音信号处理[M].北京:机械工业出版社,2003.
[2] 程利忠, 张宪民. 基于语音识别的说话人身份辨识系统.上海交通大学学报,1998,32(9):86~89.
[3]李蕴华.将倒谱参数与基音信息有效结合进行说话人辨认[J].信号处理, Vol.16 , 2000. 3 : 85-89 .
[4] ZHANGWan-feng,WU Zhao-hui,YANGY ing-chun,MA Zh i-you, Feature Combination For Speaker Identification[J] , Vol . 21 , 2003 . 3 : 10-15.
[5] 刘永红.说话人识别系统的研究[D].研究生学位论文,西南交通大学,2003.4
[6] 王金甲.噪声环境下鲁棒性文本自由说话人辨认系统的研究.[硕士学位论文],秦皇岛:燕山大学信息科学和工程学院,2003