【財華社訊】9月12日,據"小米技術"微信公眾號消息,近日,小米集團AI實驗室新一代 Kaldi 團隊發佈了基於 Flow Matching 架構的ZipVoice繫列語音合成(TTS)模型——ZipVoice(零樣本單說話人語音合成模型)與ZipVoice-Dialog(零樣本對話語音合成模型)。ZipVoice解決了現有零樣本語音合成模型的參數量大、合成速度慢的痛點,在輕量化建模和推理加速上取得了重要突破。ZipVoice-Dialog 則解決了現有對話語音合成模型在穩定性和推理速度上的瓶頸,實現了又快又穩又自然的語音對話合成。
財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。
下載財華財經APP,把握投資先機
https://www.finet.com.cn/app
更多精彩内容,請點擊:
財華網(https://www.finet.hk/)
財華智庫網(https://www.finet.com.cn)
現代電視FINTV(https://www.fintv.hk)