請輸入關鍵字:

熱門搜尋:

港大發表 AI 圖像生成能力排名榜 DeepSeek Janus-Pro 包尾

2025年3月10日 下午14:20

各大 AI 廠商要確定其 AI 的能力,都會提供一些獨立的測試評分。市場上有不少相關的測試平台,熱門的有 OpenCompass 、 ARC 基準測試、HellaSwag 基準測試等等,中國則有大模型測評機構 SuperCLUE 等。香港大學經管學院也加入成為測試員,並發表《人工智能模型圖像生成能力綜合評測報告》,針對 15 個「文生圖模型」及 7 個「多模態大語言模型」進行評估。研究顯示,早前引起全球關注的 DeepSeek 新推出的文生圖模型 Janus-Pro 在新圖像生成方面表現欠佳。
《人工智能模型圖像生成能力綜合評測報告》主要針對新圖像生成及對現有圖像修改兩種任務的表現。首先,新圖像生成任務的評測包含內容質素及安全與責任性兩方面。
1. 內容質素 — 透過三個維度進行評估,再由專家評分者在模型一對一比較的情況下進行評價,最終以 Elo 評分進行科學排名。
2. 安全與責任性 — 衡量人工智能模型在生成新圖像時的安全合規性與社會責任意識,測試指令涵蓋以下類別:偏見與歧視、違法活動、危險元素、倫理道德、版權侵犯以及隱私/肖像侵犯。
報告顯示,字節跳動的即夢 AI 和豆包及百度的文心一言,在新圖像生成的內容質素及圖像修改的表現突出。而部分文生圖模型雖然在內容質素方面表現優異,卻在安全與責任方面的表現強差人意。整體而言,與文生圖模型相比,多模態大語言模型整體表現較佳。

來源:電腦廣場

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。

下載APP 下載財華財經APP,把握投資先機
更多精彩内容,請點擊: 財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

相關視頻

快訊

10:30
【異動股】青蒿素板塊下挫,新 和 成(002001.CN)跌4.34%
10:17
北鬥星通:與中科宇航沒有業務合作
10:15
【異動股】船舶制造板塊拉升,松發股份(603268.CN)漲10.0%
10:08
海看股份:自建算力中心的設施建設正在按規劃穩步推進
10:00
【異動股】租售同權板塊下挫,濱江集團(002244.CN)跌3.61%
10:00
【異動股】光纖概念板塊拉升,通光線纜(300265.CN)漲11.08%
09:50
諾比侃(02635.HK)漲超14% 獲​調入港股通標的證券名單
09:45
【異動股】刀片電池板塊下挫,和勝股份(002824.CN)跌4.24%
09:45
【異動股】通信線纜及配套板塊拉升,通鼎互聯(002491.CN)漲9.98%
09:45
【異動股】港股跌幅榜前十,南方兩倍做空MSTR-U(09399.HK)跌18.16%,茂盛控股(00022.HK)跌13.97%