小米集團AI實驗室發佈高效零樣本語音合成模型ZipVoice

日期：2025年9月12日上午11:19

【財華社訊】9月12日，據"小米技術"微信公眾號消息，近日，小米集團AI實驗室新一代 Kaldi 團隊發佈了基於 Flow Matching 架構的ZipVoice繫列語音合成(TTS)模型——ZipVoice(零樣本單說話人語音合成模型)與ZipVoice-Dialog(零樣本對話語音合成模型)。ZipVoice解決了現有零樣本語音合成模型的參數量大、合成速度慢的痛點，在輕量化建模和推理加速上取得了重要突破。ZipVoice-Dialog 則解決了現有對話語音合成模型在穩定性和推理速度上的瓶頸，實現了又快又穩又自然的語音對話合成。

更多精彩內容，請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)