请输入关键字:

热门搜寻:

马斯克:AI训练数据已耗尽,合成数据将成未来方向

 
日期: 2025年1月9日 下午7:02

PANews 1月9日消息,据TechCrunch报道,埃隆・马斯克在与Stagwell董事长Mark Penn的直播对话中表示,目前AI模型的训练已基本耗尽真实世界的数据,“我们已经用尽了人类知识的累积总和,这在去年就发生了。”马斯克与前OpenAI首席科学家Ilya Sutskever的观点一致,后者在NeurIPS机器学习大会上提出AI行业已达到“数据峰值”,未来可能需要改变模型开发方式。

马斯克认为,合成数据将是补充真实数据的途径,AI将通过生成和自我评估数据实现自我学习。这一趋势已被包括微软、Meta、OpenAI和Anthropic等科技巨头采用,如微软Phi-4模型和谷歌Gemma模型都结合了真实数据和合成数据进行训练。Gartner预测,2024年AI和分析项目中约60%的数据将为合成生成。

合成数据的优势包括成本节约,例如AI初创公司Writer仅花费约70万美元开发其几乎完全基于合成数据的Palmyra X 004模型,相比之下,类似规模的OpenAI模型开发成本约为460万美元。然而,合成数据也存在风险,包括模型创造力下降、输出偏差加剧,以及潜在的模型崩溃,尤其当训练数据本身存在偏差时,生成结果也可能受到影响。

内容来源:PANews

财华网所刊载内容之知识产权为财华网及相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至 content@finet.com.hk,获得书面确认及授权后,方可转载。

下载APP 下载财华财经APP,把握投资先机
更多精彩内容,请点击: 财华网(https://www.finet.hk/) 财华智库网(https://www.finet.com.cn) 现代电视FINTV(http://www.fintv.hk)

PANews

PANews是区块链和Web3.0领域领先的智库型信息平台,为行业用户提供具有国际视野的前沿资讯与报告。PANews优质多元的内容以图文、音频、视频等形式在全网多渠道覆盖,包含推特、微博、抖音、视频号等主流平台,旨在成为用户的Web3信息官。PANews同时还是腾讯新闻的内容合作伙伴,内容被福布斯、财新等媒体引用,获得腾讯新闻、今日头条、澎湃新闻等颁发的相关奖项。PANews的两位联合创始人均为福

视频

快讯

17:32
【盈警】百盛集团(03368.HK)料2025年股东应占亏损约​1.86亿元
17:27
市场监管总局约谈阿里巴巴、抖音、百度、腾讯、京东、美团、淘宝闪购等平台企业
17:19
富力地产(02777.HK)1月销售收入约7.2亿元
17:14
中广核新能源(01811.HK)1月完成发电量同比增加7.9%
17:11
【盈喜】前海健康(00911.HK)料2025年股东应占溢利500万至600万港元
16:53
中国石油化工股份(00386.HK):李永林辞任执行董事等职务
16:40
【盈警】瑞安房地产(00272.HK)料2025年​股东应占亏损净额17亿至18亿元
16:23
三部门:支持白酒、黄酒等中式酒品与中式美食"酒餐融合协同出海"
16:08
三部门:到2028年培育3个以上千亿级传统优势酒产区 10个以上百亿级特色酿酒产业园区
15:59
【盈警】维信金科(02003.HK)料年度综合净亏损5亿至6亿元