Techub News 消息,據 CryptoBriefing 報道,階躍星辰(StepFun)發佈的語音模型 StepAudio 2.5 Realtime 在 2026 年 4 月的五項主流基準測試中均排名第一,主觀人類評價得分 80.41 分,較前代基綫提升 10 分。 該模型採用端到端架構,支持中英文實時交互,並引入副語言理解能力以識別語調、情緒和語速。技術報告顯示,其通過角色扮演特定的 RLHF 技術保持角色一致性,區別於傳統的語音識別-語言模型-語音合成流水綫。
内容來源:TECHUB NEWS
財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。