語音識別芯片的原理
嵌入式語(yu)(yu)音識別系統都采(cai)用了(le)模式匹配的(de)(de)(de)原理。錄入的(de)(de)(de)語(yu)(yu)音信(xin)(xin)號(hao)首(shou)先經過預處理,包(bao)括語(yu)(yu)音信(xin)(xin)號(hao)的(de)(de)(de)采(cai)樣(yang)、反混疊濾波(bo)、語(yu)(yu)音增強,接下來(lai)是(shi)特(te)征提取(qu),用以從語(yu)(yu)音信(xin)(xin)號(hao)波(bo)形中提取(qu)一(yi)組或(huo)幾(ji)組能夠描述語(yu)(yu)音信(xin)(xin)號(hao)特(te)征的(de)(de)(de)參數。特(te)征提取(qu)之后的(de)(de)(de)數據一(yi)般分(fen)為(wei)兩個(ge)步驟,第(di)一(yi)步是(shi)系統“學習”或“訓練”階段,這一階段的任務是構建參考模式庫,詞表中每個詞對應一個參考模式,它由這個詞重復發音多遍,再經特征提取和某種訓練中得到。第二是“識別”或“測試”階段,按照一定的準則求取待測語音特征參數和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
語音識別芯片分類
按照使用者的限制而言,語音識別芯片可(ke)以分為(wei)特定人(ren)語(yu)音識別(bie)芯(xin)片和非特定人(ren)語(yu)音識別(bie)芯(xin)片。
特定人語音識別
特(te)(te)定(ding)人(ren)(ren)語(yu)(yu)音(yin)(yin)識(shi)別(bie)芯片是針對(dui)指定(ding)人(ren)(ren)的語(yu)(yu)音(yin)(yin)識(shi)別(bie),其他人(ren)(ren)的話不(bu)識(shi)別(bie),須先把使用(yong)者的語(yu)(yu)音(yin)(yin)參考樣本存入當成比對(dui)的資料庫,即特(te)(te)定(ding)人(ren)(ren)語(yu)(yu)音(yin)(yin)識(shi)別(bie)在使用(yong)前必須要(yao)進行(xing)語(yu)(yu)音(yin)(yin)訓練(lian),一般按照機器提示訓練(lian)2遍語音詞條(tiao)即可使用。
非特定人語音識別
非特定(ding)(ding)人語(yu)音識別(bie)是(shi)不用(yong)針(zhen)對指(zhi)定(ding)(ding)的人的識別(bie)技術(shu),不分年(nian)齡、性別(bie),只要說相同語(yu)言就可以(yi),應用(yong)模式是(shi)在產品定(ding)(ding)型(xing)前按照確定(ding)(ding)的十幾個(ge)語(yu)音交互(hu)詞(ci)條,采集(ji)200人左右的聲音樣本,經過PC算(suan)法(fa)處理(li)得到交互(hu)詞(ci)條的語(yu)音模型和特(te)征數據庫,然(ran)后燒錄(lu)到芯片上。應用這種芯片的機器(智能娃娃、電子寵物、兒童電腦)就具有交互(hu)功(gong)能了。
非特(te)定人(ren)語(yu)音識(shi)別應用有的(de)是基(ji)于音素(su)的(de)算法,這(zhe)種模(mo)式下不需(xu)要采集很多人(ren)的(de)聲音樣本就(jiu)可以做交互識(shi)別,但是缺點是識(shi)別率不高,識(shi)別性能(neng)不穩定。
按照說話方式的(de)連續(xu)性,語音(yin)識別(bie)芯(xin)片又(you)可分為非(fei)連續(xu)語音(yin)識別(bie)和連續(xu)語音(yin)識別(bie)。
非連續語音識別
對于非連續(xu)語音來說(shuo)(shuo)(shuo),識(shi)別所(suo)說(shuo)(shuo)(shuo)的每一個(ge)字必(bi)須分開(kai)辨認,要(yao)求說(shuo)(shuo)(shuo)完每個(ge)字后都要(yao)停頓。
連續語音識別
連續語音(yin)識(shi)別可(ke)以一般自然流利的(de)說話(hua)方式來進行人性化(hua)的(de)語音(yin)識(shi)別,但由于(yu)關系到相連音(yin)的(de)問(wen)題,很難(nan)達到好的(de)辨(bian)認效果。
申明:以上內容源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,請注意甄別內容來源的真實性和權威性。