
DeepSeek星期五(4月24日)在社媒平台公布,全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。官方称,V4有能力处理长达百万字的超长上下文,在智能体能力、世界知识和推理性能方面处在中国和开源领域的领先地位。 (法新社档案照) 中国人工智能(AI)公司深度求索(DeepSeek)发布备受关注的最新旗舰AI模型的预览版。新模型与美国竞争对手的顶尖模型有一定差距,但适配中国科技巨头华为昇腾晶片的“国产化替代”,被认为是一大亮点。 DeepSeek星期五(4月24日)在社媒平台公布,全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。官方称,V4有能力处理长达百万字的超长上下文,在智能体能力、世界知识和推理性能方面处在中国和开源领域的领先地位。 V4按模型大小分为“Pro”与“Flash”两个版本,分别对应“专家模式”和“快速模式”。DeepSeek称,V4-Pro在世界知识测评中大幅领先其他开源模型,但稍逊于谷歌的顶尖闭源模型Gemini-Pro-3.1。 DeepSeek公布两版模型价格时披露,受限于高端算力供给,Pro版本当前服务吞吐十分有限,预计下半年华为昇腾950超节点批量上市后,Pro版本价格将大幅下调。 华为同日发文称,昇腾一直同步支持DeepSeek系列模型,此次通过双方“芯模技术紧密协同”,实现昇腾超节点全系列产品支持V4系列模型。 

中国晶片股股价星期五集体上涨。华为的主要晶片供应商中芯国际的股价大涨10%,华虹半导体则涨超15%。DeepSeek中国竞争对手的股价则暴跌,智普AI和MiniMax的股价均下跌9%。 中国媒体《财经》指出,DeepSeek的新模型是否会提前适配华为昇腾950等中国国产AI晶片,甚至基于国产晶片完成训练,一直受到市场关注。“目前可以确认的是,DeepSeek-V4一定会支持华为昇腾950,并使用昇腾950进行推理。但它不一定是基于华为昇腾950训练的。” 大多数主流AI模型都是在英伟达晶片上进行训练和运行的。美国外交关系协会中国与新兴技术高级研究员麦奎尔(Chris McGuire)发文分析,DeepSeek并未像以往般公开提及V4的训练成本或使用晶片数量,很可能是因为训练所用的晶片,是美国晶片巨头英伟达最先进的Blackwell晶片。这款晶片已被美国禁止对华出口。 深度求索发布新模型前夕,美国白宫指责中国公司正大规模窃取美国AI技术,并誓言将采取行动,防止盗窃行为。 华盛顿从2022年开始限制中国获取美国公司生产的先进AI晶片,北京此后加快了实现技术自给自足的步伐。 中国天使投资人、AI专家郭涛接受《联合早报》采访时评估:“它(DeepSeek-V4)也是用了英伟达再加上华为昇腾的芯片(晶片),昇腾的比例可能占得也比较高,相对来说打破了英伟达的算力垄断。国产化的算力芯片规模化落地,这是一个比较大的亮点。” DeepSeek去年初曾凭借低成本模型R1震惊世界,被称为“DeepSeek时刻”。郭涛认为,V4此次带来的冲击力有限,“综合技术方面来说,跟国外的大模型还是有一些差距”。 麦奎尔也说,V4或许是中国目前最好的模型,但优势并不明显;它也无法与美国顶尖模型相媲美,未能动摇关于中美AI竞争现状的共识:“美国模型领先约七个月,而中国领先的模型仍依赖美国技术。”
|