设万维读者为首页 万维读者网 -- 全球华人的精神家园 广告服务 联系我们 关于万维
 
首  页 新  闻 视  频 博  客 论  坛 分类广告 购  物
搜索>> 发表日志 控制面板 个人相册 给我留言
帮助 退出
雷歌视角  
让沉默的思想如闪电,点燃我的文字,照亮这个世界。  
https://blog.creaders.net/u/31182/ > 复制 > 收藏本页
网络日志正文
DeepSeek:到底是AI颠覆者还是低级小偷? 2025-01-31 15:02:27

DeepSeek:到底是AI颠覆者还是低级小偷?

雷歌 2025年1月31日


DeepSeek火爆出圈已近一周。一开始是AI秩序颠覆者、厉害国“弯道超车”的最新神话,没几天又变成数据小偷、“汉芯”二世、故事大王,剧情翻来覆去,一会儿天堂,一会儿地狱,DeepSeek就在吃瓜群众的二极世界中来回蹦极。

但真实世界永远比二极管思维复杂。现实中的DeepSeek也一样。今天我讲关于DeepSeek的三个问题,希望能给DeepSeek一个相对准确的定位,尽可能还原事件的真相。


一、DeepSeek是AI格局的颠覆者吗?

不是。看过我前两篇文章的朋友应该知道我的答案及其理由,我至今没有改变我的看法。

DeepSeek横空出世确实惊动了世界,但也只是“惊动”,没有改变格局。即使让全球市值第一的芯片大佬英伟达一夜蒸发了近6000亿美元,但这只是华尔街和市场的过度反应。DeepSeek会给AI发展带来新变化,但它不是颠覆者。仅凭一款本质上是个“山寨”产品的AI语言大模型,不可能改变美国主导AI发展的现有格局。

为什么说DeepSeek在1月20日推出的最新R1大模型本质上只是个“山寨”产品?经过近一周各方专业人士对DeepSeek-R1的分析解读,它惊动世界的“低成本”优势来源于两个方面:模型架构设计及算法上的创新,以及它的“数据蒸馏”方法。“蒸馏”方法依赖于对更好的“老师模型”数据的萃取,它省钱且高效,但出来的产品整体上无法超越“老师模型”(局部可以),因此,哪怕它在方法上再有创意,本质上还是个山寨产品。

现在DeepSeek推出的R1语言大模型,虽然以极低的成本(据说只有美国AI大公司的1/10或1/20甚至1/30)训练出许多指标可以与OpenAI的ChatGPT4相媲美的AI大模型,但DeepSeek现在也只敢说R1的性能指标超越了现有的“开源模型”。对R1深度测试过的专业人士,均确认DeepSeek-R1只是一些常用考评指标与ChatGPT4相当,让一般使用者觉得“够用”了,还那么便宜。但无法从整体上超越它的蒸馏对象ChatGPT4。

因为已经有了类似ChatGPT等成型在先的原创AI大模型,DeepSeek-R1这种低成本山寨版才可能出现。作为一种产品,它本质上是模仿,只是模仿的方法比较巧妙,比较有创意。用DeepSeek自己的话说这叫“站在巨人的肩膀上”。

换个角度看,如果请梁文锋的深度探索公司做一个目前没有的原创性AI应用模型,比如像谷歌早年的AlphaGO,或现在特斯拉正在开发的FSD自动驾驶平台,梁文锋怎么做呢?深度探索还能低成本做出来吗?不可能,因为原创性的AI大模型无法用“蒸馏”法降低成本,因为缺乏“蒸馏”对象。

因此,用低成本方法做一个别人已经做过的AI大模型是一回事,原创一个别人没做过的AI平台则是另一回事。而AI给世界带来的一切改变,归根到底得靠原创。

到目前为止,改变世界和人类生活的AI原创平台都是美国大公司创造的,这是目前的大格局。这个总体格局不会因为DeepSeek用省钱的方法推出一个精巧的“复制品”就被轻易颠覆。

墙内墙外许多民族主义情结深重的国人,无论是华为推出Mate 60,比亚迪宣布年售电动车超特斯拉,还是DeepSeek发布R1语言大模型,他们都像嗑了药,一下肾上腺素狂飙,宣布中国真牛逼、美国不行了,中国即将雄霸世界等等。这些人大都生活在习式“中国梦”里,哪怕他们身在美国。他们的“民族自豪感”让世界的一切在他们眼里都变了形。一个人爱国并不是错,但如果“爱国”爱得这么愚蠢、这么变态,实际上于国无补,反而有害。这样的“爱国”,不爱也罢。


二、DeepSeek只是个低级小偷吗?

两天前一些媒体开始揭发DeepSeek可能使用“蒸馏”法违规盗取了ChatGPT的数据,OpenAI和微软称正在调查此事,而OpenAI更直接宣布已经掌握了DeepSeek盗用大量数据的证据后,DeepSeek顷刻变成了人人喊打的小偷。

由于中国公司习惯从别人那里偷东西已经全世界出了名,这次一曝出DeepSeek偷数据,不少人自然嗤之以鼻,很自然地从DeepSeek联想到当年的“汉芯”事件(注:2003年上海一教授从国外买了摩托罗拉芯片,回来磨掉商标,自称是自己研发的“汉芯一号”。由多名院士组成的专家组鉴定后认为达到“国际先进水平”,由此成为当年“厉害了我的国”的重大事件。该教授因此获得许多荣誉和上亿的科研资金,三年后才被戳穿,成为国际丑闻),认为DeepSeek就是“汉芯”第二,除了偷就是骗。先进国家花几亿几十亿才研发出一个AI大模型,你用558万就搞掂了?所谓的“低成本”奇迹,就是个精心编造的“大跃进”故事,DeepSeek就是“故事大王”。

DeepSeek有没有“编故事”?照我看还真有。DeepSeek说只用了2048块英伟达H800芯片,仅用55天就完成了大模型训练,一共只花了557.6万美元。训练出来的AI大模型,比美国大公司花多少亿搞出来的一点不差。但DeepSeek说的557.6万美元,实际是R1的前一个版本V 3的预训练GPU小时数折算的花费。而仅2048块H800芯片,价格就超过6000万美元。因此这557.6万显然并不包括训练平台的搭建和其他费用。此外,升级版R1的训练费用根本就没公布,宣传时有点故意用V3版的费用鱼目混珠。笼统地跟美国大公司的数亿美元比,就有明显“编故事”的味道。说实话,编故事的宣传效果还真好,不光是DeepSeek名声大振,还连带把美国股市一天砸掉上万亿。

DeepSeek违规盗用OpenAI的数据,而且精心编了个故事,是不是一个只会偷和骗的小茅贼呢?这么想的人还真是把事情想简单了。

我们注意到,尽管微软和OpenAI称正在调查DeepSeek违规使用蒸馏ChatGPT的数据,而且从OpenAI的表态看,DeepSeek违规使用OpenAI数据一事证据都在手上,基本上没跑。但微软CEO纳德拉在昨天微软四季度财报发布会上,依然对DeepSeek的创新赞不绝口。纳德拉称DeepSeek“有一些真的创新”,而AI成本下降是必然趋势。

也就是说,纳德拉认为DeepSeek训练大模型成本的大幅降低,除了从OpenAI蒸馏数据这种投机取巧之外,它还是有一些业内认可的真正的科技创新,就是我在前两篇文章中提到过的模型架构设计上的工程创新和算法上的技术创新。这些在DeepSeek发表的相关论文中都有详细介绍,也得到了行内专业人士的普遍认可。

在前两篇文章中,我一直肯定,DeepSeek低成本模型的推出,至少对AI大模型的建设具有方法论上的意义,将促进行业转换思路,寻找降低成本的可行方法。从这几天业内大佬们如微软CEO纳德拉和Meta老板扎克伯格等人的反应来看,他们都肯定了DeepSeek的出现对AI发展的积极意义,会推动其他公司探索降低成本的方法。类似的方法应该也能在原创性AI大模型的训练中得到应用,从而降低模型训练的成本,提高效率。

所以,DeepSeek的出现并不是一个单纯的“汉芯“偷窃或欺骗事件,其中包含着对全行业有启发意义的真实的技术创新和天才的工程优化。尽管DeepSeek推出的产品并无新意,谈不上颠覆,但其中包含的方法却耳目一新。


三、地缘政治与大国博弈:DeepSeek会遭封禁吗?

从DeepSeek“偷”数据案发,许多人就预计,美国对中国的技术封锁将会收紧。一方面是领先的AI大公司会有严格的措施防范对手随意蒸馏数据等 “偷盗”手段。另一方面,则是美国政府会进一步收紧对中国的芯片禁运,甚至直接像对付TikTok一样,以国家安全的名义把DeepSeek列入黑名单。此前,美国海军已经宣布,在海军内部禁止任何使用DeepSeek。

这几天,也有一种观点沉渣泛起,就像前两年华为推出Mate60时一样,认为对中国的芯片禁运,除了让一些美国公司赚不到钱外,还有一个更大的副作用,就是迫使中国自己研发出自己的高端芯片。因此,美国的芯片禁运可以休矣。

这种说法,听上去完全是中共带节奏的口风。因为中共最盼望的就是美国在芯片禁运上松绑,芯片禁运卡住了中共的脖子,已经让它翻白眼了。普通吃瓜群众也跟着这种论调起哄,如果不是坏,那就只能是蠢了。

也有人说,如果DeepSeek确有创新,是一家新兴创新公司,那就不该对它封禁,而应该放手让它进入市场,参与竞争,这有利于AI行业的健康发展。

但DeepSeek是不是一家简单的私营创新公司呢?

认真研究DeepSeek这次横空出世一鸣惊人的全过程,我觉得它不太像一个公司主导的简单科技事件,背后有中共操控的魅影。梁文锋执掌的深度探索公司,似乎也不像表面看上去那么简单。一个账面上只有4个社保员工、也从未对外融资的小型创新公司,如何能够在注册一年半后就突然爆发,成为震动全球AI行业的新贵?

看国内的报道,梁文锋早年利用AI平台做量化投资,他经营的私募基金一度达到上千亿规模,成为国内四强之一。报道说那时梁文锋为了搭建人工智能平台,在美国实施芯片禁运前,就大量采购了英伟达高端芯片,是当时具有上万块高端芯片集群的仅有的几家中国公司之一。现在回头去看这件事,不免令人生疑。上万块英伟达高端芯片是什么概念?每块芯片至少两三万美金,上万块就是好几亿美金,一家小的初创公司能像阿里或腾讯这样的互联网巨头一样大手笔地囤积高端芯片?最近又有一种说法,说梁文锋的深度探索公司实际拥有5万块英伟达H100芯片,是通过越南的中间买家违规转手过来的。这看上去就更不像普通公司的行为。

另外,DeepSeek发布最新的R1版本时,正好是1月20日,当天恰好是川普宣誓就职重返白宫的日子。挑这么个日子发布,有没有挑战川普2.0的意思?而且,20日当天,梁文锋还进中南海参加了总理李强主持的一个座谈会,会上梁文锋做了主题发言,当晚还上了新闻联播。

梁文锋看上去只是一家民营创新公司的创办人,但围绕这家公司的各种迹象,让人感到整个公司都笼罩着中共的巨大阴影,有只无形的手操控着这家公司的一切。营造DeepSeek一鸣惊人放卫星的奇迹,似乎是一个“东升西降”的经典案例,样样都呼应着打败美帝的节奏。

目前,中美对抗已经成为冷战结束后新的世界格局的主轴。而人类社会正在步入AI时代。掌握AI发展的主动权,成了大国竞争必须抢占的制高点。

所以,进一步收紧对华芯片禁运,是完全可以预期的事。如果哪天DeepSeek被美国政府列入黑名单,我一点也不会感到意外。


更多精彩内容请看:

1)万维博客“雷歌视角”:

https://blog.creaders.net/uindex.php

2)油管频道“雷歌视角”:

https://www.youtube.com/channel/UClfm_D5GrSVn59znfs8JD1g

欢迎关注“雷歌视角”,帮你挖掘新闻背后的新闻。

欢迎订阅、转发和点赞。谢谢!


浏览(1054) (10) 评论(0)
发表评论
我的名片
雷歌747 ,3岁
注册日期: 2022-06-17
访问总量: 1,858,438 次
点击查看我的个人资料
Calendar
最新发布
· DeepSeek:到底是AI颠覆者还是低
· DeepSeek偷了OpenAI的数据? Ope
· 深度:DeepSeek 能不能颠覆全球A
· LG杯决赛柯洁连续两盘违规判负创
· 川普新政将是一场伟大的社会变革
· 川普对TT态度大反转 澄清三疑惑
· 国会投票戏剧性大翻转 议长约翰
分类目录
【时政评论】
· DeepSeek:到底是AI颠覆者还是低
· DeepSeek偷了OpenAI的数据? Ope
· 深度:DeepSeek 能不能颠覆全球A
· LG杯决赛柯洁连续两盘违规判负创
· 川普新政将是一场伟大的社会变革
· 川普对TT态度大反转 澄清三疑惑
· 国会投票戏剧性大翻转 议长约翰
· 马斯克出手惊天动地 国会预算案
· TikTok面临封禁命悬一线 川普会
· 突发:叙利亚叛军攻入首都 阿萨
存档目录
2025-01-19 - 2025-01-31
2024-12-02 - 2024-12-21
2024-11-03 - 2024-11-27
2024-10-02 - 2024-10-29
2024-09-10 - 2024-09-27
2024-08-03 - 2024-08-26
2024-07-13 - 2024-07-31
2024-06-02 - 2024-06-28
2024-05-01 - 2024-05-31
2024-04-03 - 2024-04-19
2024-03-01 - 2024-03-31
2024-02-08 - 2024-02-28
2024-01-04 - 2024-01-30
2023-12-01 - 2023-12-22
2023-11-01 - 2023-11-29
2023-10-03 - 2023-10-27
2023-09-03 - 2023-09-29
2023-08-03 - 2023-08-27
2023-07-04 - 2023-07-31
2023-06-03 - 2023-06-29
2023-05-03 - 2023-05-28
2023-04-02 - 2023-04-30
2023-03-02 - 2023-03-31
2023-02-06 - 2023-02-26
2023-01-18 - 2023-01-30
2022-12-01 - 2022-12-22
2022-11-03 - 2022-11-29
2022-10-05 - 2022-10-31
2022-09-06 - 2022-09-30
2022-08-02 - 2022-08-30
2022-07-02 - 2022-07-29
2022-06-16 - 2022-06-29
 
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.