1引言
從20世紀(jì)50年代開(kāi)始對(duì)語(yǔ)音識(shí)別的研究開(kāi)始,經(jīng)過(guò)幾十年的發(fā)展已經(jīng)達(dá)到一定的高度,有的已經(jīng)從實(shí)驗(yàn)室走向市場(chǎng),如一些玩具、某些部門密碼語(yǔ)音輸入等,隨著DSP和專用集成電路技術(shù)的發(fā)展,快速傅立葉變換以及近來(lái)嵌入式操作系統(tǒng)的研究,使得特定人識(shí)別尤其是計(jì)算量小的特定人識(shí)別成為可能。因此,對(duì)特定人語(yǔ)音識(shí)別技術(shù)在汽車控制上的應(yīng)用的研究是很有前途的。
2 特定人語(yǔ)音識(shí)別的方法
目前,常用的說(shuō)話人識(shí)別方法有模板匹配法、統(tǒng)計(jì)建模法、聯(lián)接主義法(即人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn))??紤]到數(shù)據(jù)量、實(shí)時(shí)性以及識(shí)別率的問(wèn)題,筆者采用基于矢量量化和隱馬爾可夫模型(HMM)相結(jié)合的方法。
說(shuō)話人識(shí)別的系統(tǒng)主要由語(yǔ)音特征矢量提取單元(前端處理)、訓(xùn)練單元、識(shí)別單元和后處理單元組成,其系統(tǒng)構(gòu)成如圖1所示。
圖1系統(tǒng)構(gòu)成
由上圖也可以看出,每個(gè)司機(jī)在購(gòu)買車后必須將自己的語(yǔ)音輸入系統(tǒng),也就是訓(xùn)練過(guò)程,當(dāng)然最好是在安靜、次數(shù)達(dá)到一定的數(shù)目。從此在以后駕駛過(guò)程中就可以利用這個(gè)系統(tǒng)了。
所謂預(yù)處理是指對(duì)語(yǔ)音信號(hào)的特殊處理:預(yù)加重,分幀處理。預(yù)加重的目的是提升高頻部分,使信號(hào)的頻譜變得平坦,以便于進(jìn)行頻譜分析或聲道參數(shù)分析。用具有 6dB/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器實(shí)現(xiàn)。雖然語(yǔ)音信號(hào)是非平穩(wěn)時(shí)變的,但是可以認(rèn)為是局部短時(shí)平穩(wěn)。故語(yǔ)音信號(hào)分析常分段或分幀來(lái)處理。
2.1 語(yǔ)音特征矢量提取單元
說(shuō)話人識(shí)別系統(tǒng)設(shè)計(jì)中的根本問(wèn)題是如何從語(yǔ)音信號(hào)中提取表征人的基本特征。即語(yǔ)音特征矢量的提取是整個(gè)說(shuō)話人識(shí)別系統(tǒng)的基礎(chǔ),對(duì)說(shuō)話人識(shí)別的錯(cuò)誤拒絕率和錯(cuò)誤接受率有著極其重要的影響。同語(yǔ)音識(shí)別不同,說(shuō)話人識(shí)別利用的是語(yǔ)音信號(hào)中的說(shuō)話人信息,而不考慮語(yǔ)音中的字詞意思,它強(qiáng)調(diào)說(shuō)話人的個(gè)性。因此,單一的語(yǔ)音特征矢量很難提高識(shí)別率。該系統(tǒng)在說(shuō)話人的識(shí)別中采用倒譜系數(shù)加基因周期參數(shù),而在對(duì)控制命令的語(yǔ)音識(shí)別中僅采用倒譜系數(shù)。其中,常用的倒譜系數(shù)有2 種,即LPC(線性預(yù)測(cè)系數(shù))和倒譜參數(shù)(LPCC),一種是基于Mel刻度的MFLL(頻率倒譜系數(shù))參數(shù)(Mel頻率譜系數(shù))。
對(duì)于LPCC參數(shù)的提取, 可先采用Durbin遞推算法、格型算法或者Schur遞推算法來(lái)求LPC系數(shù),然后求LPC參數(shù)。設(shè)第l幀語(yǔ)音的LPC系數(shù)為αn,則LPCC的參數(shù)為1<n≤p
其中p為L(zhǎng)PCC系數(shù)的階數(shù),k為L(zhǎng)PCC系數(shù)的遞推次數(shù)。
進(jìn)一步的研究發(fā)現(xiàn),引入一階和二階差分倒譜可以提高識(shí)別率。
對(duì)于MPCC參數(shù)的提取,若根據(jù)Mel曲線將語(yǔ)音信號(hào)頻譜分為K個(gè)頻帶,每個(gè)頻帶的能量為θ(Mk),則 MFCC參數(shù)為1<n≤p
通過(guò)對(duì)LPCC和MFCC參數(shù)對(duì)識(shí)別率影響的實(shí)驗(yàn)比較,筆者選取LPCC參數(shù)及其一階和二階差分倒譜稀疏作為大功率電感特征參數(shù)。
基音周期估計(jì)的方法很多,主要有基于求短時(shí)自相關(guān)函數(shù)的算法、基于求短時(shí)平均幅度差函數(shù)(AMDF)的算法、基于同態(tài)信號(hào)處理和線性預(yù)測(cè)編碼的算法。筆者僅介紹基于求短時(shí)自相關(guān)函數(shù)的算法。
設(shè)Sw(n)是一段加窗語(yǔ)音信號(hào),它的非零區(qū)間為0<n≤n-1。Sw(n)的自相關(guān)函數(shù)稱為語(yǔ)音信號(hào)的S(n)的短時(shí)自相關(guān)函數(shù),用Rw(l)表差模電感示,即Rw(電感生產(chǎn)廠家l)=可知短時(shí)自相關(guān)函數(shù)在Rw(0)處最大,且在基音周期的各個(gè)整數(shù)倍點(diǎn)上有很大的峰值,選擇合適的窗函數(shù)(窗長(zhǎng)為40ms的Hamming窗)與濾波器(帶寬為60~900Hz的帶通濾波器)后,只要找到自相關(guān)函數(shù)的第一最大峰值點(diǎn)的位置并計(jì)算電感器大小它與零點(diǎn)的距離,便能估計(jì)出基音周期。 大功率電感廠家 |大電流電感工廠