聲紋識別原理
聲(sheng)(sheng)紋是用電聲(sheng)(sheng)學儀器(qi)(qi)(qi)顯(xian)示的(de)(de)攜帶言語信息的(de)(de)聲(sheng)(sheng)波(bo)頻譜。人(ren)類語言的(de)(de)產生(sheng)是人(ren)體語言中樞(shu)與發(fa)音器(qi)(qi)(qi)官之間一個(ge)復雜(za)的(de)(de)生(sheng)理物理過程,人(ren)在講話(hua)時使用的(de)(de)發(fa)聲(sheng)(sheng)器(qi)(qi)(qi)官--舌(she)、牙齒、喉(hou)頭、肺(fei)、鼻腔在尺寸和形態方面每個(ge)人(ren)的(de)(de)差異很大(da),所以(yi)任何(he)兩個(ge)人(ren)的(de)(de)聲(sheng)(sheng)紋圖譜都有差異。這(zhe)也(ye)使得(de)聲(sheng)(sheng)紋識(shi)別也(ye)可(ke)以(yi)稱為(wei)身份認證的(de)(de)一種(zhong)方式(shi)。
聲紋識別優缺點
1、聲紋識(shi)別的優勢在于:
(1)聲紋提取(qu)方便(bian),可在不知(zhi)不覺中完成,因(yin)此使用(yong)者(zhe)的接受程(cheng)度也高;
(2)獲(huo)取語音的(de)識別成本低廉,使用簡單,一個(ge)麥(mai)克風即可,在使用通訊設備時(shi)更無(wu)需額外的(de)錄音設備;
(3)適合遠程身份確認,只需要一個麥克風或電話、手機就(jiu)可以通過網路(通訊網絡或(huo)互聯(lian)網絡)實現遠程(cheng)登錄(lu);
(4)聲(sheng)紋辨認和(he)確(que)認的算法復雜度低;
(5)配合一些其他(ta)措施,如通過語音識(shi)別進行內容鑒別等,可(ke)以提高準(zhun)確率(lv)。這些優(you)勢使得聲紋識(shi)別的應用(yong)越來(lai)越受到系(xi)統開發(fa)者和用(yong)戶青睞。
2、聲(sheng)紋(wen)識(shi)別(bie)的缺點:
當然,聲紋(wen)(wen)識別(bie)的(de)(de)(de)應用有(you)(you)一些缺點,比如同一個(ge)人(ren)(ren)的(de)(de)(de)聲音(yin)(yin)具有(you)(you)易(yi)(yi)變性(xing),易(yi)(yi)受身(shen)體狀(zhuang)況(kuang)、年齡、情緒(xu)等的(de)(de)(de)影響(xiang);比如不(bu)同的(de)(de)(de)麥克風和信道對識別(bie)性(xing)能有(you)(you)影響(xiang);比如環(huan)境噪音(yin)(yin)對識別(bie)有(you)(you)干擾;又比如混(hun)合說話人(ren)(ren)的(de)(de)(de)情形(xing)下人(ren)(ren)的(de)(de)(de)聲紋(wen)(wen)特征不(bu)易(yi)(yi)提取等等。
聲紋識別的過程
聲(sheng)(sheng)紋識別的過程包(bao)括(kuo):語音信號處理、聲(sheng)(sheng)紋特征提取、聲(sheng)(sheng)紋建模、聲(sheng)(sheng)紋比對、判別決策等(deng)。
聲紋識別匹配模式
聲紋識別技術的關鍵在于(yu)對各種聲學特征(zheng)參數(shu)進行(xing)處理,并確定模(mo)式(shi)匹配(pei)方法,主要的模(mo)式(shi)匹配(pei)方法包括:
1、模(mo)板匹配方法(fa):利用(yong)(yong)動(dong)態時間彎折(DTW)以對(dui)準訓練和測(ce)試特征序(xu)列,主要用(yong)(yong)于固(gu)定詞組的(de)應用(yong)(yong)(通常為文本(ben)相(xiang)關(guan)任務(wu));
2、最(zui)近(jin)鄰(lin)方法:訓練(lian)時(shi)保留所有特征矢量,識別時(shi)對(dui)每(mei)個(ge)矢量都找(zhao)到訓練(lian)矢量中最(zui)近(jin)的K個(ge),據此進行識別,通常模型存儲和(he)相似計算的量都很(hen)大;
3、神(shen)經網絡方(fang)法:有很多種形(xing)式,如(ru)多層感知、徑向基函數(RBF)等,可(ke)以顯式訓(xun)練以區(qu)分說(shuo)話人(ren)和其背(bei)景說(shuo)話人(ren),其訓(xun)練量很大,且模型的(de)可(ke)推廣性不(bu)好;
5、VQ聚類方法(如LBG):效果(guo)比較好(hao),算(suan)法復(fu)雜度也不高,和HMM方法配合起來更(geng)可以收到更(geng)好(hao)的效果(guo);
6、多項式分(fen)類器方法:有較(jiao)(jiao)高的精度,但模型存儲和計算量都(dou)比較(jiao)(jiao)大(da);
此外還(huan)有概率統計方法(fa)、動態(tai)時間(jian)規整方法(fa)、矢量量化方法(fa)等(deng)(deng)等(deng)(deng)。
聲紋識別技術的難點
目前,聲紋識別技術的(de)(de)市場應用并(bing)不(bu)廣泛,,但并(bing)非這(zhe)項技術本身(shen)不(bu)成熟,而是由于實際商業應用場景的(de)(de)復(fu)雜性(xing),很可能導致身(shen)份識別產生較(jiao)大誤差。
首先,說話(hua)人(ren)的語音(yin)(yin)聲(sheng)學特征不(bu)可避免(mian)地具有(you)發展性和變異性,既便是(shi)(shi)同一(yi)(yi)個人(ren),即便采集到的兩段語音(yin)(yin)內容都是(shi)(shi)相(xiang)同的,但是(shi)(shi)在不(bu)同的時期(qi)或特殊的情境下,由于情緒、語速、疲勞程度等原因,聲(sheng)紋特征也不(bu)盡一(yi)(yi)致;
其(qi)次(ci),聲(sheng)(sheng)紋特征提取是在(zai)現實環境中進(jin)行的(de)(de),如何降噪(zao)以及去混(hun)響依然是聲(sheng)(sheng)紋識(shi)別的(de)(de)一大難題。在(zai)外部(bu)環境中,各種(zhong)噪(zao)音都會通(tong)過錄音設備采集進(jin)來(lai),這些噪(zao)音會在(zai)一定程(cheng)度上混(hun)淆或者淹沒(mei)說話人(ren)信息,使(shi)得聲(sheng)(sheng)紋系統無法(fa)獲取準確的(de)(de)說話人(ren)聲(sheng)(sheng)紋特征。因此(ci),應用聲(sheng)(sheng)紋識(shi)別技術的(de)(de)產品大多適(shi)合在(zai)相對安靜(jing)的(de)(de)場合使(shi)用。