數碼錄音筆工作原理
數(shu)碼錄音筆通(tong)過(guo)對(dui)聲音的模(mo)擬(ni)信號的采樣、編碼,將模(mo)擬(ni)信號通(tong)過(guo)數(shu)模(mo)轉(zhuan)換(huan)器轉(zhuan)換(huan)為數(shu)字信號,并(bing)進行(xing)壓縮后進行(xing)存儲。
智能錄音筆工作原理
語(yu)音交互,只(zhi)需要短短幾(ji)秒鐘便可翻譯出文字。所謂語(yu)音轉(zhuan)換成文字用(yong)到(dao)了語(yu)音交互中一項(xiang)ASR技術。
建立聲(sheng)學(xue)模(mo)型(xing):由于每(mei)個(ge)人發音(yin)、語(yu)調、語(yu)速等各不相(xiang)同,需要將同一(yi)個(ge)單詞(ci)或(huo)漢字(zi)讓不同用戶(hu)錄取,以便機器識(shi)別更多的(de)人。聲(sheng)學(xue)模(mo)型(xing)建立過程需要錄入大量(liang)的(de)原(yuan)始用戶(hu)聲(sheng)音(yin),以從中提取特征建立聲(sheng)學(xue)模(mo)型(xing)數(shu)據庫。
建立語言(yan)(yan)模型(xing):同聲(sheng)學(xue)(xue)模型(xing),也需要大量文字信息的儲(chu)存(cun)。語言(yan)(yan)模型(xing)可以對聲(sheng)學(xue)(xue)模型(xing)進(jin)行匹配與調整,讓(rang)正確率盡可能(neng)提高,語句(ju)更加通順。
語(yu)音識(shi)別(bie)(bie):有前兩步作為基礎的情(qing)況下,最終形(xing)成的數據(ju)庫(ku)(ku)存儲在設備(bei)本(ben)地或(huo)(huo)云端,再進(jin)行實時語(yu)音識(shi)別(bie)(bie)。將(jiang)用戶的語(yu)音輸(shu)入(ru)進(jin)行編碼和特征提取,將(jiang)提取到(dao)(dao)的特征拿到(dao)(dao)聲學模型(xing)庫(ku)(ku)中去查詢(xun),得(de)到(dao)(dao)單(dan)個的單(dan)詞或(huo)(huo)漢(han)字;然后再拿到(dao)(dao)語(yu)言模型(xing)庫(ku)(ku)中去查詢(xun),得(de)到(dao)(dao)最匹配的單(dan)詞或(huo)(huo)漢(han)字。