DeepSeek 窃取美国的技术了吗?
沙河
一大早起来看到,“白宫AI 顾问认为DeepSeek 可能窃取了美国的技术”。看了一下,注意到其指控是:DeepSeek疑似利用「蒸馏」技术盗用open AI模型输出成果。 这个可能是对的。Deepseek确实可能利用蒸馏技术获取数据用于自家模型的训练。 它们似乎也没有否定,还把几个蒸馏模型挂在网上。但这不是窃取技术。说盗取数据,就准确多了,微软和open AI就是怎么说的。 重点是,利用蒸馏数据训练并不是DeepSeek 取得成功的关键。DeepSeek 之所以能够后来居上,一鸣惊人,是因为两项原创技术/算法: 一,在大模型构架 上,开发出Multi-Head latent Attention(MLA)和 MOE架构,优化网络通讯路径,训练模型省时 省电省(算)力。 二, 在大模型“后训练”上采用直接强化学习, 使得模型展示出更高的智能,在 数学 、编程和推理的表现上尤为突出。 这里,第二项远比第一项重要。省时省电省算力,当然好,但这些都是钱可以解决的。而”用钱可以解决的事都不是事”,这句话在AI 界更成立。 用钱不能解决,至少不能很快解决的是,如何迅速提高智能? 人工智能模型的最终比拼是其产品的智能高低。超级智能 叫ASI, 最高的无所不知的是Digital God (数码神)。“得AI者得天下” 这个说法的终极意思应该是, “得数码神者得天下”。 什么意思?笔者两年前的文章对此有解释: “Digital God (DG), 就是像上帝一样无所不知的人工智能。 人类知道的, DG知道;人类不知道的,DG也知道。DG 可望发现可科学,帮助人类解决重大问题。 "比如说,如果问DG,怎样获得室温常压超导材料? 它可能会告诉你, 把什么什么材料按什么什么比例混合,在什么温度和什么压力下冶炼, 然后再怎么怎么淬火等等,可得室温常压超导材料。如此这般,世界上百多个凝聚态物理材料物理团队几十年来苦心孤诣而不得的材料,一举得来。 "再比如说, 当地球人面临危机时, 如何迅速逃离地球?马斯克等人类想到的是坐飞船去火星。( 不可行, 太远, 也不宜居)。 DG可能会告诉你,可以如此这般造一个虫洞,从虫洞走, 达到另一宇宙上的一个可居行星。 从虫洞走, 逃离地球, 搞得好只有一步之遥,可以瞬间到达 。 ” 普通人看了这几句话,一头雾水,没关系。如果中美政府高层和业界高层,没听说或者不明白这几句话,可能会有严重后果。但是,据笔者所知,至少有一个人明白,他就是openAI的CEO 。笔者看过他两年来访谈节目,知道他的目标是DG, AI 的星辰大海。
|