
PANews 2月27日消息,據Cointelegraph報道,開源AI實驗室Sentient宣佈推出Arena,這是一個用於評估AI代理在企業級工作流程中表現的生産級測試環境。Pantera Capital和Franklin Templeton的數字資産部門已加入Arena的首批測試隊列。
Sentient表示,Arena並非靜態模型測試,而是通過模擬包含長文檔、不完整信息和沖突來源的企業條件,對AI代理進行標準化任務測試。平台會跟蹤幻覺、證據缺失、引用錯誤和推理漏洞等失敗類別,幫助開發者診斷問題。Arena計劃通過公開排行榜發佈對比性能指標,並發佈總結常見失敗模式和修復方案的測試報告。
内容來源:PANews
財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。