聲紋識別是什么帶你走進聽聲辨人的科技

本文章由注冊用戶知識君上傳提供評論發布反饋 0

摘要：除了指紋識別、人臉識別和虹膜識別，聲紋識別也屬于生物識別的一種，被廣泛應用于智能產品、金融和刑偵等領域。什么是聲紋識別？聲紋識別即運用聲音來識別人的身份，聲紋識別的原理在于把聲信號轉換成電信號在進行對比識別。那么聲紋識別的優缺點是什么？其過程又是什么呢？下面一起來看看詳細介紹。

聲紋識別原理

聲(sheng)(sheng)紋是用電聲(sheng)(sheng)學儀器(qi)(qi)(qi)顯(xian)示的(de)(de)攜帶言語信息的(de)(de)聲(sheng)(sheng)波(bo)頻譜。人(ren)類語言的(de)(de)產生(sheng)是人(ren)體語言中樞(shu)與發(fa)音器(qi)(qi)(qi)官之間一個(ge)復雜(za)的(de)(de)生(sheng)理物理過程，人(ren)在講話(hua)時使用的(de)(de)發(fa)聲(sheng)(sheng)器(qi)(qi)(qi)官--舌(she)、牙齒、喉(hou)頭、肺(fei)、鼻腔在尺寸和形態方面每個(ge)人(ren)的(de)(de)差異很大(da)，所以(yi)任何(he)兩個(ge)人(ren)的(de)(de)聲(sheng)(sheng)紋圖譜都有差異。這(zhe)也(ye)使得(de)聲(sheng)(sheng)紋識(shi)別也(ye)可(ke)以(yi)稱為(wei)身份認證的(de)(de)一種(zhong)方式(shi)。

聲紋識別優缺點

1、聲紋識(shi)別的優勢在于：

（1）聲紋提取(qu)方便(bian)，可在不知(zhi)不覺中完成，因(yin)此使用(yong)者(zhe)的接受程(cheng)度也高；

（2）獲(huo)取語音的(de)識別成本低廉，使用簡單，一個(ge)麥(mai)克風即可，在使用通訊設備時(shi)更無(wu)需額外的(de)錄音設備；

（3）適合遠程身份確認，只需要一個麥克風或電話、手機就(jiu)可以通過網路（通訊網絡或(huo)互聯(lian)網絡）實現遠程(cheng)登錄(lu)；

（4）聲(sheng)紋辨認和(he)確(que)認的算法復雜度低；

（5）配合一些其他(ta)措施，如通過語音識(shi)別進行內容鑒別等，可(ke)以提高準(zhun)確率(lv)。這些優(you)勢使得聲紋識(shi)別的應用(yong)越來(lai)越受到系(xi)統開發(fa)者和用(yong)戶青睞。

2、聲(sheng)紋(wen)識(shi)別(bie)的缺點：

當然，聲紋(wen)(wen)識別(bie)的(de)(de)(de)應用有(you)(you)一些缺點，比如同一個(ge)人(ren)(ren)的(de)(de)(de)聲音(yin)(yin)具有(you)(you)易(yi)(yi)變性(xing)，易(yi)(yi)受身(shen)體狀(zhuang)況(kuang)、年齡、情緒(xu)等的(de)(de)(de)影響(xiang)；比如不(bu)同的(de)(de)(de)麥克風和信道對識別(bie)性(xing)能有(you)(you)影響(xiang)；比如環(huan)境噪音(yin)(yin)對識別(bie)有(you)(you)干擾；又比如混(hun)合說話人(ren)(ren)的(de)(de)(de)情形(xing)下人(ren)(ren)的(de)(de)(de)聲紋(wen)(wen)特征不(bu)易(yi)(yi)提取等等。

聲紋識別的過程

聲(sheng)(sheng)紋識別的過程包(bao)括(kuo)：語音信號處理、聲(sheng)(sheng)紋特征提取、聲(sheng)(sheng)紋建模、聲(sheng)(sheng)紋比對、判別決策等(deng)。

聲紋識別匹配模式

聲紋識別技術的關鍵在于(yu)對各種聲學特征(zheng)參數(shu)進行(xing)處理，并確定模(mo)式(shi)匹配(pei)方法，主要的模(mo)式(shi)匹配(pei)方法包括：

1、模(mo)板匹配方法(fa)：利用(yong)(yong)動(dong)態時間彎折（DTW）以對(dui)準訓練和測(ce)試特征序(xu)列，主要用(yong)(yong)于固(gu)定詞組的(de)應用(yong)(yong)（通常為文本(ben)相(xiang)關(guan)任務(wu)）；

2、最(zui)近(jin)鄰(lin)方法：訓練(lian)時(shi)保留所有特征矢量，識別時(shi)對(dui)每(mei)個(ge)矢量都找(zhao)到訓練(lian)矢量中最(zui)近(jin)的K個(ge)，據此進行識別，通常模型存儲和(he)相似計算的量都很(hen)大；

3、神(shen)經網絡方(fang)法：有很多種形(xing)式，如(ru)多層感知、徑向基函數（RBF）等，可(ke)以顯式訓(xun)練以區(qu)分說(shuo)話人(ren)和其背(bei)景說(shuo)話人(ren)，其訓(xun)練量很大，且模型的(de)可(ke)推廣性不(bu)好；

5、VQ聚類方法（如LBG）：效果(guo)比較好(hao)，算(suan)法復(fu)雜度也不高，和HMM方法配合起來更(geng)可以收到更(geng)好(hao)的效果(guo)；

6、多項式分(fen)類器方法：有較(jiao)(jiao)高的精度，但模型存儲和計算量都(dou)比較(jiao)(jiao)大(da)；

此外還(huan)有概率統計方法(fa)、動態(tai)時間(jian)規整方法(fa)、矢量量化方法(fa)等(deng)(deng)等(deng)(deng)。

聲紋識別技術的難點

目前，聲紋識別技術的(de)(de)市場應用并(bing)不(bu)廣泛,，但并(bing)非這(zhe)項技術本身(shen)不(bu)成熟，而是由于實際商業應用場景的(de)(de)復(fu)雜性(xing)，很可能導致身(shen)份識別產生較(jiao)大誤差。

首先，說話(hua)人(ren)的語音(yin)(yin)聲(sheng)學特征不(bu)可避免(mian)地具有(you)發展性和變異性，既便是(shi)(shi)同一(yi)(yi)個人(ren)，即便采集到的兩段語音(yin)(yin)內容都是(shi)(shi)相(xiang)同的，但是(shi)(shi)在不(bu)同的時期(qi)或特殊的情境下，由于情緒、語速、疲勞程度等原因，聲(sheng)紋特征也不(bu)盡一(yi)(yi)致；

其(qi)次(ci)，聲(sheng)(sheng)紋特征提取是在(zai)現實環境中進(jin)行的(de)(de)，如何降噪(zao)以及去混(hun)響依然是聲(sheng)(sheng)紋識(shi)別的(de)(de)一大難題。在(zai)外部(bu)環境中，各種(zhong)噪(zao)音都會通(tong)過錄音設備采集進(jin)來(lai)，這些噪(zao)音會在(zai)一定程(cheng)度上混(hun)淆或者淹沒(mei)說話人(ren)信息，使(shi)得聲(sheng)(sheng)紋系統無法(fa)獲取準確的(de)(de)說話人(ren)聲(sheng)(sheng)紋特征。因此(ci)，應用聲(sheng)(sheng)紋識(shi)別技術的(de)(de)產品大多適(shi)合在(zai)相對安靜(jing)的(de)(de)場合使(shi)用。

標簽： 生物科技智能家居智能人工智能門禁安防 ★

關聯文章推薦

加載更多

網站提醒和聲明

本(ben)(ben)(ben)站(zhan)為注(zhu)冊用戶提供信(xin)(xin)息存(cun)儲空間服(fu)務，非(fei)“MAIGOO編(bian)輯(ji)上傳(chuan)(chuan)提供”的文(wen)(wen)章(zhang)/文(wen)(wen)字均是注(zhu)冊用戶自主發布上傳(chuan)(chuan)，不代表(biao)本(ben)(ben)(ben)站(zhan)觀點，更(geng)不表(biao)示(shi)本(ben)(ben)(ben)站(zhan)支持購買和(he)交易，本(ben)(ben)(ben)站(zhan)對(dui)網頁中內容的合法性、準(zhun)確(que)性、真實性、適用性、安全性等概(gai)不負(fu)責。版(ban)權(quan)歸(gui)原作者所(suo)有，如有侵權(quan)、虛假信(xin)(xin)息、錯誤信(xin)(xin)息或任何問(wen)題，請及時聯(lian)系(xi)我們，我們將(jiang)在第一時間刪除或更(geng)正(zheng)。申請刪除>> 糾錯>> 投訴侵權>>

提交說(shuo)明(ming)：快速提交發布>> 查看提交幫助>> 注冊登錄>>