|
|
美媒:DeepSeek V4将搭载华为晶片运行
美国媒体称,中国人工智能(AI)企业深度求索(DeepSeek)即将推出的新一代模型V4,将采用科技巨头华为设计的最新晶片(昇腾 950PR )。美国科技媒体《The Information》星期五(4月3日)引述五名知情人士报道上述消息。报道指出,为筹备V4发布,包括阿里巴巴、字节跳动和腾讯控股在内的多家中国科技巨头,已对华为即将推出的晶片下达大规模订单,总量达数十万枚。
DeepSeek V4 预计几周内发布。谁手里有芯片,谁就能第一时间通过自家云服务把模型跑起来,集成进 AI 应用。950PR 是华为专门为推理设计的芯片。华为昇腾计算业务负责人张迪轩在 3 月的合作伙伴大会上说,950PR 的算力大约是英伟达 H20 的 2.87 倍。
很多人讨论中美芯片博弈的时候,老是聚焦在"这颗芯片行不行"、"制程差几纳米"这些硬件参数上。但如果你站到更高的视角看,美国对华芯片封锁的核心逻辑,从来就不只是怕中国造出一颗好芯片。它真正怕的是中国形成一个自洽的AI计算生态闭环。什么意思?就是从底层芯片,到芯片上面的算子库,到编译器,到AI框架,到大模型,到终端应用——这一整条链条全部实现国产化,各环节能互相咬合、互相迭代、自我进化。
为什么这个生态闭环比单颗芯片可怕得多?因为单颗芯片可以通过限制光刻机、限制EDA软件、限制先进制程来卡你。但一旦生态闭环形成,它就会有自己的生命力——用户越多,反馈越多,迭代越快,越来越好用,越来越离不开。到那时候,封锁就从卡脖子变成了你关上了一扇门,但人家从窗户爬出去了,而且在窗户外面盖了新房子。
英伟达CUDA生态就是一个典型的生态闭环。CUDA从2006年发布至今将近20年,全球几百万AI开发者在上面写代码、做研究、建产品。这个生态的护城河不是任何一块芯片的性能参数,而是十几年积累下来的代码库、教程、社区、工具链、以及开发者的肌肉记忆。比如AMD,它家的芯片性能其实也不差,但它的ROCm生态用起来就是没有CUDA顺手,不是差一点半点,而是差了十几年的积累。
中国的国产AI芯片生态,之前一直面临一个类似的困境:没有足够强的模型愿意认真在上面跑。这是一个"鸡生蛋蛋生鸡"的死循环——模型公司嫌国产芯片难用,能用英伟达就用英伟达,不愿意花精力适配国产芯片。而芯片公司呢?因为没有大模型真的跑在上面,就缺少真实场景的负载反馈,不知道该优先修哪些bug、优化哪些算子,改进速度自然就慢。速度慢,模型公司就更不愿意来,恶性循环。
DeepSeek V4跑在华为芯片上,相当于一锤子把这个死循环砸开了一道口子。DeepSeek曾经尝试用华为昇腾芯片训练推理模型R2,但遭遇了反复失败。芯片稳定性有问题,集群互联速度太慢,华为的软件工具链也不成熟,训练任务跑着跑着就崩了。最后DeepSeek不得不退回英伟达硬件做训练,华为芯片只拿来做推理。
这段"黑历史"说明什么?说明到今天为止,训练这个环节,华为芯片大概率还是不行的。 V4的训练,几乎可以肯定还是在英伟达GPU上完成的。但V4这次的突破发生在推理端,而推理才是AI商业化真正烧钱的环节。推理端能用国产芯片替代,这件事的经济意义,可能比很多人想象的大得多。
更深的一层,叫生态位卡位。DeepSeek现在是中国最强的开源大模型公司之一,如果它率先证明世界前沿的大模型可以在华为芯片上流畅运行,那它的身份就不仅仅是一个AI模型公司了——它会变成中国AI国产化进程的关键节点。这个身份意味着什么?意味着政策层面的优先支持,意味着华为会把最好的芯片资源和工程师团队优先向它倾斜,意味着政 府和国企客户在采购AI服务时会优先考虑"全国产方案",意味着其他中国AI公司如果也想往国产芯片上迁移,可能要参照DeepSeek趟出来的路。
这就像当年智能手机刚起来的时候,三星率先all in安卓生态,别人还在犹豫,它已经和谷歌绑在了一起。后来安卓成了主流,三星自然就成了安卓阵营的老大。DeepSeek现在做的事,本质上是一样的。它在"赌"国产AI芯片生态的未来,同时用自己的影响力帮这个生态加速成熟。它不是一个被禁运逼到墙角的被动受害者,它是一个主动抢占新生态位的布局者。这两个身份看起来差不多,但思维方式完全不一样。
中国第一梯队的大模型+中国第一梯队的AI芯片,在推理端实现了真实可用的适配。DeepSeek花几个月时间重写底层代码来配合华为芯片,这个过程本身就在帮华为的软件栈"填坑"——每一个踩到的bug、每一个性能瓶颈,都会变成华为CANN团队的改进输入。这就会产生一个飞轮效应:DeepSeek V4证明国产芯片能跑前沿模型→其他模型公司看到后也开始尝试迁移→华为获得更多真实负载数据和bug反馈→芯片和软件栈加速迭代→体验越来越好→更多模型迁移→生态越来越丰富……
补充一个信息,DeepSeek目前还在开发两个V4变体版本,分别面向不同的能力侧重,同样基于国产芯片。这说明它不只是试试水,而是在系统性地把整条模型产品线往国产芯片上迁移。这个动作的决心和投入力度,远超一次性的PR行为。
飞轮一旦转起来,速度会越来越快。国产AI计算生态的闭环正在加速成型。


|
|