【財華社訊】9月12日,據"小米技術"微信公眾號消息,近日,小米集團AI實驗室新一代 Kaldi 團隊發佈了基於 Flow Matching 架構的ZipVoice繫列語音合成(TTS)模型——ZipVoice(零樣本單說話人語音合成模型)與ZipVoice-Dialog(零樣本對話語音合成模型)。ZipVoice解決了現有零樣本語音合成模型的參數量大、合成速度慢的痛點,在輕量化建模和推理加速上取得了重要突破。ZipVoice-Dialog 則解決了現有對話語音合成模型在穩定性和推理速度上的瓶頸,實現了又快又穩又自然的語音對話合成。
更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)