请输入关键字:

热门搜寻:

【杜兰说AI】AI平权 or 给对手送武器? 3分钟带你完全理解 DeepSeek五天开源周

2025年3月17日 上午10:15

DeepSeek真的就这麽放心让对手抄作业?
全部开源
是不是也在给对手送武器?
自此DeepSeek出来之後,
这样的问题就一直不少,
尤其是刚刚结束的DeepSeek开源周,
我真的是看着全球的开发者从一开始
眼巴巴等着今天又会开源什麽王炸技术,
到最後忍不住表示:
要不然DeepSeek你还是给自己留个後手吧?

首先我觉得很重要的一点,
虽然这次DeepSeek 是完全面向开发者进行开源的,
但我还是觉得每个人都应该或多或少地了解一点,
现在最前沿的AI,
到底走到了一个什麽阶段。

简单给大家用大白话解释一下哈,
DeepSeek的开源一共持续了五天,
第一天的高性能计算库FlashMLA,
大家可以理解成一个GPU的性能榨干器。
它能让一块国内阉割版的H800,
干出2.4块旗舰机显卡A100的活儿。

第二天,开源通信库DeepEP,
相当於给以前合作只能靠吼的专家模型们拉了个群,
大幅度降低了沟通成本,
让模型训练的时间必传统方案缩短了40%。

第三天的DeepGEMM
本质上是一个AI计算的加速器,
但传统加速方法可能要上万行代码才能实现,
它只用了300行代码,
对於中小型团队来说,
又是一次游戏规则的改写。

第四天,
DeepSeek直接把自家的底子拿出来了,
公开了V3和R1模型的工业级部署方案,
解决了AI并行计算中有人忙得要死,
有人又在摸鱼的情况,
通过计算-通信的重叠,
让AI模型学会了边算边聊,
最终提升了30%的硬件利用率。

第五天,
压轴的是DeepSeek全系列模型的核心装备,
3FS文件系统和Smallpond数据框架,
它们主要负责存储与数据处理,
喝一杯咖啡,
5分钟左右的时间,
就能处理完人类文明史上所有的书籍。

了解了DeepSeek这五天到底都开源了什麽,
我再来回答开头的那个问题,
DeepSeek这狂踩牙膏的开源,
到底是不是在给对手送武器?

我觉得这件事,
大家要站在一个更高的维度去看。
在现在的经济态势下,
是像Meta丶xAI这些不差钱的大厂多,
还是缺钱的中小型团队多?
肯定是後者,
除了这些中小型团队,
还有很多根本就没钱的个人开发者,
所以这五天的开源,
影响的是全世界的科研团队。
开源,
不仅仅是这次的DeepSeek,
还有开源这个概念诞生之初,
为的就是通过共享来集中大家的智慧,
也就是我们常说的那句老话:
“人多力量大”

更多精彩内容
请登陆
财华香港网(https://www.finet.hk/)或
现代电视(https://www.fintv.hk)

相關視頻

快讯

10:54
科技股普涨!百度集团续升8%,旗下昆仑芯申请上市
17:36
上交所公开募集不动产投资信托基金(REITs)业务办法(试行)
17:29
央行印发《非银行支付机构分类评级管理办法》
17:18
中国证监会印发《中国证监会关于推出商业不动产投资信托基金试点的公告》
17:13
国家外汇局:三季度中国经常账户顺差14165亿元 资本和金融账户逆差17144亿元
17:03
香港金管局:截至11月30日外汇基金总资产41069亿港元
16:56
2024年全国体育产业总规模38421亿元
16:45
香港金管局:11月份新批出按揭贷款额较环比减少7%至291亿港元
16:32
香港金管局:11月份港元货币供应量M2及M3同比均上升4.5%
16:29
交银国际(03329.HK):谭岳衡辞任执行董事

付饶说RWA

这里是连接现实资产与数字世界的思想阵地。 付饶是RWA.ltd CEO,香港国际新经济研究院执行董事...

长桥証券

投资的本质是认知的变现,研究的意义是认知的提升!...

有连云

国内领先的智能金融信息引擎

PANews

PANews是区块链和Web3.0领域领先的智库型信息平台,为行业用户提供具有国际视野的前沿资讯与报...