請輸入關鍵字:

熱門搜尋:

馬斯克:AI訓練數據已耗盡,合成數據將成未來方向

日期: 2025年1月9日 下午7:02

PANews 1月9日消息,據TechCrunch報道,埃隆·馬斯克在與Stagwell董事長Mark Penn的直播對話中表示,目前AI模型的訓練已基本耗盡真實世界的數據,「我們已經用盡了人類知識的累積總和,這在去年就發生了。」馬斯克與前OpenAI首席科學家Ilya Sutskever的觀點一致,後者在NeurIPS機器學習大會上提出AI行業已達到「數據峰值」,未來可能需要改變模型開發方式。

馬斯克認為,合成數據將是補充真實數據的途徑,AI將通過生成和自我評估數據實現自我學習。這一趨勢已被包括微軟、Meta、OpenAI和Anthropic等科技巨頭採用,如微軟Phi-4模型和谷歌Gemma模型都結合了真實數據和合成數據進行訓練。Gartner預測,2024年AI和分析項目中約60%的數據將為合成生成。

合成數據的優勢包括成本節約,例如AI初創公司Writer僅花費約70萬美元開發其幾乎完全基於合成數據的Palmyra X 004模型,相比之下,類似規模的OpenAI模型開發成本約為460萬美元。然而,合成數據也存在風險,包括模型創造力下降、輸出偏差加劇,以及潛在的模型崩潰,尤其當訓練數據本身存在偏差時,生成結果也可能受到影響。

内容來源:PANews

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。

更多精彩内容,請點擊: 財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

視頻

快訊

17:36
【盈警】國富量子(00290.HK)料年度擁有人應佔綜合虧損不超21.38億港元
17:27
中煙香港(06055.HK)料中期權益持有人應佔利潤同比降10%至15%
17:15
央行、證監會:支持香港推出五年期人民幣國債期貨
17:09
香港交易所與中金所續簽合作備忘錄
17:07
七部門:健全完善流量監管規則和管理機制 推動平台算法透明化
17:02
七部門:引導平台企業加強通用大模型、行業大模型和智能體等人工智能領域創新布局
16:47
香港計劃2026年8月3日推出五年期國債期貨
16:42
香港交易所與香港金管局推出試點項目為衍生產品收市後交易時段提供數碼支付方案
16:41
中證指數有限公司發布商業不動產REITs估值
16:35
市場監管總局督導貨拉拉落實反壟斷合規整改