芒果视频下载

網(wang)站分類
登錄 |    

聲紋識別是什么 帶你走進聽聲辨人的科技

本文章由注冊用戶 知識君 上傳提供 評論 發布 反饋 0
摘要:除了指紋識別、人臉識別和虹膜識別,聲紋識別也屬于生物識別的一種,被廣泛應用于智能產品、金融和刑偵等領域。什么是聲紋識別?聲紋識別即運用聲音來識別人的身份,聲紋識別的原理在于把聲信號轉換成電信號在進行對比識別。那么聲紋識別的優缺點是什么?其過程又是什么呢?下面一起來看看詳細介紹。

聲紋識別原理

聲(sheng)(sheng)紋是用電聲(sheng)(sheng)學儀器(qi)(qi)(qi)顯(xian)示的(de)(de)攜帶言語信息的(de)(de)聲(sheng)(sheng)波(bo)頻譜。人(ren)類語言的(de)(de)產生(sheng)是人(ren)體語言中樞(shu)與發(fa)音器(qi)(qi)(qi)官之間一個(ge)復雜(za)的(de)(de)生(sheng)理物理過程,人(ren)在講話(hua)時使用的(de)(de)發(fa)聲(sheng)(sheng)器(qi)(qi)(qi)官--舌(she)、牙齒、喉(hou)頭、肺(fei)、鼻腔在尺寸和形態方面每個(ge)人(ren)的(de)(de)差異很大(da),所以(yi)任何(he)兩個(ge)人(ren)的(de)(de)聲(sheng)(sheng)紋圖譜都有差異。這(zhe)也(ye)使得(de)聲(sheng)(sheng)紋識(shi)別也(ye)可(ke)以(yi)稱為(wei)身份認證的(de)(de)一種(zhong)方式(shi)。

該圖片由注冊用戶"知識君"提供,版權聲明反饋

聲紋識別優缺點

1、聲紋識(shi)別的優勢在于:

(1)聲紋提取(qu)方便(bian),可在不知(zhi)不覺中完成,因(yin)此使用(yong)者(zhe)的接受程(cheng)度也高;

(2)獲(huo)取語音的(de)識別成本低廉,使用簡單,一個(ge)麥(mai)克風即可,在使用通訊設備時(shi)更無(wu)需額外的(de)錄音設備;

(3)適合遠程身份確認,只需要一個麥克風或電話、手機就(jiu)可以通過網路(通訊網絡或(huo)互聯(lian)網絡)實現遠程(cheng)登錄(lu);

(4)聲(sheng)紋辨認和(he)確(que)認的算法復雜度低;

(5)配合一些其他(ta)措施,如通過語音識(shi)別進行內容鑒別等,可(ke)以提高準(zhun)確率(lv)。這些優(you)勢使得聲紋識(shi)別的應用(yong)越來(lai)越受到系(xi)統開發(fa)者和用(yong)戶青睞。

2、聲(sheng)紋(wen)識(shi)別(bie)的缺點:

當然,聲紋(wen)(wen)識別(bie)的(de)(de)(de)應用有(you)(you)一些缺點,比如同一個(ge)人(ren)(ren)的(de)(de)(de)聲音(yin)(yin)具有(you)(you)易(yi)(yi)變性(xing),易(yi)(yi)受身(shen)體狀(zhuang)況(kuang)、年齡、情緒(xu)等的(de)(de)(de)影響(xiang);比如不(bu)同的(de)(de)(de)麥克風和信道對識別(bie)性(xing)能有(you)(you)影響(xiang);比如環(huan)境噪音(yin)(yin)對識別(bie)有(you)(you)干擾;又比如混(hun)合說話人(ren)(ren)的(de)(de)(de)情形(xing)下人(ren)(ren)的(de)(de)(de)聲紋(wen)(wen)特征不(bu)易(yi)(yi)提取等等。

聲紋識別的過程

聲(sheng)(sheng)紋識別的過程包(bao)括(kuo):語音信號處理、聲(sheng)(sheng)紋特征提取、聲(sheng)(sheng)紋建模、聲(sheng)(sheng)紋比對、判別決策等(deng)。

聲紋識別匹配模式

聲紋識別技術的關鍵在于(yu)對各種聲學特征(zheng)參數(shu)進行(xing)處理,并確定模(mo)式(shi)匹配(pei)方法,主要的模(mo)式(shi)匹配(pei)方法包括:

1、模(mo)板匹配方法(fa):利用(yong)(yong)動(dong)態時間彎折(DTW)以對(dui)準訓練和測(ce)試特征序(xu)列,主要用(yong)(yong)于固(gu)定詞組的(de)應用(yong)(yong)(通常為文本(ben)相(xiang)關(guan)任務(wu));

2、最(zui)近(jin)鄰(lin)方法:訓練(lian)時(shi)保留所有特征矢量,識別時(shi)對(dui)每(mei)個(ge)矢量都找(zhao)到訓練(lian)矢量中最(zui)近(jin)的K個(ge),據此進行識別,通常模型存儲和(he)相似計算的量都很(hen)大;

3、神(shen)經網絡方(fang)法:有很多種形(xing)式,如(ru)多層感知、徑向基函數(RBF)等,可(ke)以顯式訓(xun)練以區(qu)分說(shuo)話人(ren)和其背(bei)景說(shuo)話人(ren),其訓(xun)練量很大,且模型的(de)可(ke)推廣性不(bu)好;

5、VQ聚類方法(如LBG):效果(guo)比較好(hao),算(suan)法復(fu)雜度也不高,和HMM方法配合起來更(geng)可以收到更(geng)好(hao)的效果(guo);

6、多項式分(fen)類器方法:有較(jiao)(jiao)高的精度,但模型存儲和計算量都(dou)比較(jiao)(jiao)大(da);

此外還(huan)有概率統計方法(fa)、動態(tai)時間(jian)規整方法(fa)、矢量量化方法(fa)等(deng)(deng)等(deng)(deng)。

聲紋識別技術的難點

目前,聲紋識別技術的(de)(de)市場應用并(bing)不(bu)廣泛,,但并(bing)非這(zhe)項技術本身(shen)不(bu)成熟,而是由于實際商業應用場景的(de)(de)復(fu)雜性(xing),很可能導致身(shen)份識別產生較(jiao)大誤差。

首先,說話(hua)人(ren)的語音(yin)(yin)聲(sheng)學特征不(bu)可避免(mian)地具有(you)發展性和變異性,既便是(shi)(shi)同一(yi)(yi)個人(ren),即便采集到的兩段語音(yin)(yin)內容都是(shi)(shi)相(xiang)同的,但是(shi)(shi)在不(bu)同的時期(qi)或特殊的情境下,由于情緒、語速、疲勞程度等原因,聲(sheng)紋特征也不(bu)盡一(yi)(yi)致;

其(qi)次(ci),聲(sheng)(sheng)紋特征提取是在(zai)現實環境中進(jin)行的(de)(de),如何降噪(zao)以及去混(hun)響依然是聲(sheng)(sheng)紋識(shi)別的(de)(de)一大難題。在(zai)外部(bu)環境中,各種(zhong)噪(zao)音都會通(tong)過錄音設備采集進(jin)來(lai),這些噪(zao)音會在(zai)一定程(cheng)度上混(hun)淆或者淹沒(mei)說話人(ren)信息,使(shi)得聲(sheng)(sheng)紋系統無法(fa)獲取準確的(de)(de)說話人(ren)聲(sheng)(sheng)紋特征。因此(ci),應用聲(sheng)(sheng)紋識(shi)別技術的(de)(de)產品大多適(shi)合在(zai)相對安靜(jing)的(de)(de)場合使(shi)用。

網站提醒和聲明
本(ben)(ben)(ben)站(zhan)為注(zhu)冊用戶提供信(xin)(xin)息存(cun)儲空間服(fu)務,非(fei)“MAIGOO編(bian)輯(ji)上傳(chuan)(chuan)提供”的文(wen)(wen)章(zhang)/文(wen)(wen)字均是注(zhu)冊用戶自主發布上傳(chuan)(chuan),不代表(biao)本(ben)(ben)(ben)站(zhan)觀點,更(geng)不表(biao)示(shi)本(ben)(ben)(ben)站(zhan)支持購買和(he)交易,本(ben)(ben)(ben)站(zhan)對(dui)網頁中內容的合法性、準(zhun)確(que)性、真實性、適用性、安全性等概(gai)不負(fu)責。版(ban)權(quan)歸(gui)原作者所(suo)有,如有侵權(quan)、虛假信(xin)(xin)息、錯誤信(xin)(xin)息或任何問(wen)題,請及時聯(lian)系(xi)我們,我們將(jiang)在第一時間刪除或更(geng)正(zheng)。 申請刪除>> 糾錯>> 投訴侵權>>
提交說(shuo)明(ming): 快速提交發布>> 查看提交幫助>> 注冊登錄>>
發表評論
您還未登錄,依《網絡安全法》相關要求,請您登錄賬戶后再提交發布信息。點擊登錄>>如您還未注冊,可,感謝您的理解及支持!
最新評(ping)論
暫無評論
頁面相關分類
熱門模塊
已有1642927個品牌入駐 更新517447個招商信息 已發布1569922個加盟需求 已有1284307條品牌點贊