發布語(yu)(yu)音合(he)(he)成技(ji)術(shu)(shu)KAN-TTS,基于KAN-TTS技(ji)術(shu)(shu)的(de)合(he)(he)成語(yu)(yu)音可將該數據提(ti)高到(dao)(dao)97%以(yi)上。融合(he)(he)了(le)端到(dao)(dao)端TTS技(ji)術(shu)(shu)和傳(chuan)統TTS技(ji)術(shu)(shu),從(cong)多個方面(mian)改進了(le)語(yu)(yu)音合(he)(he)成。普通用戶定制“AI聲(sheng)音”的(de)門(men)檻(jian)更低了(le)。
發布語音合(he)成(cheng)技術KAN-TTS,據介紹,該技術可(ke)大幅提高(gao)合成(cheng)語(yu)音(yin)與真人(ren)發聲的相似度(du),并將語(yu)音(yin)合成(cheng)定制成(cheng)本降低(di)10倍以(yi)上。
KAN-TTS技(ji)術由達摩院(yuan)機器(qi)智能實驗室自主研發。阿里方面稱,基于(yu)KAN-TTS技術的合成(cheng)語音可將該數據提高到97%以(yi)上(shang)。
據悉,KAN-TTS深(shen)度融合了(le)端到端TTS技術和傳(chuan)統(tong)TTS技(ji)術,從多個方面(mian)改(gai)進(jin)了語音合成(cheng)。傳統(tong)語音合成(cheng)定制需要10小時(shi)以上的數(shu)據錄制和(he)標注(zhu),對錄音(yin)人和(he)錄音(yin)環(huan)境要(yao)求很高。從啟動定制到最終交付,項目周期長成本高。
而阿(a)里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jie)合的方法,將語音合成定制周期(qi)壓縮3倍以上。也就是說,用1小(xiao)時(shi)有(you)效錄音(yin)數據和不(bu)到兩(liang)個(ge)月制作周期,就能完成一次標準TTS定制。
此外,這使(shi)得普通用戶定制“AI聲音”的門檻更低。只需手機錄(lu)音十(shi)分(fen)鐘(zhong),就能獲(huo)得與錄(lu)制聲音高度相似的合成語音。
阿里巴巴集(ji)團正(zheng)式(shi)在(zai)香港(gang)交易所掛牌(pai)上(shang)市(shi),成(cheng)為首個同(tong)時在(zai)美股(gu)和(he)港(gang)股(gu)上(shang)市(shi)的中(zhong)國互(hu)聯網(wang)公司。這個行(xing)...
杭(hang)州(zhou)2022年第19屆亞(ya)運會(hui)組委會(hui)宣布,阿里(li)巴巴成(cheng)為(wei)杭(hang)州(zhou)亞(ya)運會(hui)官方合作伙伴。作為(wei)創新技術(shu),...
阿里巴巴集團正式在(zai)港(gang)交所掛牌上市,開盤(pan)187港(gang)元,阿里巴巴此次發行5億股新股,另有7500...
收購是企(qi)業(ye)資本經營(ying)的一種形式,是一個公司通(tong)過產權交易取得其他公司一定程度的控制(zhi)權,以實現一...