發布語音(yin)(yin)合成技術(shu)KAN-TTS,基(ji)于KAN-TTS技術(shu)的(de)合成語音(yin)(yin)可(ke)將該數據提高到97%以(yi)上。融合了端到端TTS技術(shu)和傳(chuan)統(tong)TTS技術(shu),從多個方(fang)面改進了語音(yin)(yin)合成。普通用戶(hu)定制“AI聲音(yin)(yin)”的(de)門檻更低了。
發布語(yu)音合成(cheng)技術KAN-TTS,據介紹,該技術可大幅提高合成語音(yin)與(yu)真人發聲的相(xiang)似度,并將語音(yin)合成定制成本降低10倍(bei)以上。
KAN-TTS技術(shu)由達摩院(yuan)機器(qi)智能實驗室(shi)自主(zhu)研發(fa)。阿里方面(mian)稱,基于KAN-TTS技術的合成語音可(ke)將該(gai)數據(ju)提高到97%以上。
據悉,KAN-TTS深度融合了端到(dao)端TTS技術和傳統TTS技術(shu),從多個方面(mian)改進了語音(yin)(yin)合成。傳統語音(yin)(yin)合成定(ding)制需要10小時以上的數據錄(lu)制(zhi)和標注,對(dui)錄(lu)音(yin)人和錄(lu)音(yin)環境要(yao)求(qiu)很高。從啟動定(ding)制(zhi)到最(zui)終(zhong)交(jiao)付,項目周期長成本高。
而阿里利用(yong)Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jie)合的(de)方法,將(jiang)語音合成(cheng)定制周期壓(ya)縮(suo)3倍以上(shang)。也就是說(shuo),用1小時有(you)效(xiao)錄音數據(ju)和(he)不到兩個月制作周期(qi),就能(neng)完成一次標準TTS定制。
此(ci)外,這使得普通用戶定制“AI聲音”的門(men)檻更低。只需手機(ji)錄(lu)音十分鐘,就(jiu)能獲得與錄(lu)制(zhi)聲音高(gao)度相似的合(he)成(cheng)語(yu)音。
阿里巴巴集團正(zheng)式在香港交易所(suo)掛牌(pai)上市,成為首個同(tong)時(shi)在美股和港股上市的中國互聯網(wang)公司。這個行...
杭(hang)州2022年第19屆亞運會組委會宣布,阿(a)里巴巴成為杭(hang)州亞運會官方合作伙(huo)伴。作為創新技術,...
阿(a)里巴巴集(ji)團正式在港(gang)交所掛牌上市,開盤187港(gang)元,阿(a)里巴巴此次發行5億股新股,另有(you)7500...
收購是(shi)(shi)企業(ye)資本經(jing)營的一(yi)種形式(shi),是(shi)(shi)一(yi)個公(gong)(gong)司通(tong)過產權交易取得其(qi)他公(gong)(gong)司一(yi)定程(cheng)度的控制權,以實現(xian)一(yi)...