
DeepSeek星期五(4月24日)在社媒平台公布,全新系列模型DeepSeek-V4的預覽版本正式上線並同步開源。官方稱,V4有能力處理長達百萬字的超長上下文,在智能體能力、世界知識和推理性能方面處在中國和開源領域的領先地位。 (法新社檔案照) 中國人工智能(AI)公司深度求索(DeepSeek)發布備受關注的最新旗艦AI模型的預覽版。新模型與美國競爭對手的頂尖模型有一定差距,但適配中國科技巨頭華為昇騰晶片的“國產化替代”,被認為是一大亮點。 DeepSeek星期五(4月24日)在社媒平台公布,全新系列模型DeepSeek-V4的預覽版本正式上線並同步開源。官方稱,V4有能力處理長達百萬字的超長上下文,在智能體能力、世界知識和推理性能方面處在中國和開源領域的領先地位。 V4按模型大小分為“Pro”與“Flash”兩個版本,分別對應“專家模式”和“快速模式”。DeepSeek稱,V4-Pro在世界知識測評中大幅領先其他開源模型,但稍遜於谷歌的頂尖閉源模型Gemini-Pro-3.1。 DeepSeek公布兩版模型價格時披露,受限於高端算力供給,Pro版本當前服務吞吐十分有限,預計下半年華為昇騰950超節點批量上市後,Pro版本價格將大幅下調。 華為同日發文稱,昇騰一直同步支持DeepSeek系列模型,此次通過雙方“芯模技術緊密協同”,實現昇騰超節點全系列產品支持V4系列模型。 

中國晶片股股價星期五集體上漲。華為的主要晶片供應商中芯國際的股價大漲10%,華虹半導體則漲超15%。DeepSeek中國競爭對手的股價則暴跌,智普AI和MiniMax的股價均下跌9%。 中國媒體《財經》指出,DeepSeek的新模型是否會提前適配華為昇騰950等中國國產AI晶片,甚至基於國產晶片完成訓練,一直受到市場關注。“目前可以確認的是,DeepSeek-V4一定會支持華為昇騰950,並使用昇騰950進行推理。但它不一定是基於華為昇騰950訓練的。” 大多數主流AI模型都是在英偉達晶片上進行訓練和運行的。美國外交關係協會中國與新興技術高級研究員麥奎爾(Chris McGuire)發文分析,DeepSeek並未像以往般公開提及V4的訓練成本或使用晶片數量,很可能是因為訓練所用的晶片,是美國晶片巨頭英偉達最先進的Blackwell晶片。這款晶片已被美國禁止對華出口。 深度求索發布新模型前夕,美國白宮指責中國公司正大規模竊取美國AI技術,並誓言將採取行動,防止盜竊行為。 華盛頓從2022年開始限制中國獲取美國公司生產的先進AI晶片,北京此後加快了實現技術自給自足的步伐。 中國天使投資人、AI專家郭濤接受《聯合早報》採訪時評估:“它(DeepSeek-V4)也是用了英偉達再加上華為昇騰的芯片(晶片),昇騰的比例可能占得也比較高,相對來說打破了英偉達的算力壟斷。國產化的算力芯片規模化落地,這是一個比較大的亮點。” DeepSeek去年初曾憑藉低成本模型R1震驚世界,被稱為“DeepSeek時刻”。郭濤認為,V4此次帶來的衝擊力有限,“綜合技術方面來說,跟國外的大模型還是有一些差距”。 麥奎爾也說,V4或許是中國目前最好的模型,但優勢並不明顯;它也無法與美國頂尖模型相媲美,未能動搖關於中美AI競爭現狀的共識:“美國模型領先約七個月,而中國領先的模型仍依賴美國技術。”
|