DeepSeek 竊取美國的技術了嗎?
沙河
一大早起來看到,“白宮AI 顧問認為DeepSeek 可能竊取了美國的技術”。看了一下,注意到其指控是:DeepSeek疑似利用「蒸餾」技術盜用open AI模型輸出成果。 這個可能是對的。Deepseek確實可能利用蒸餾技術獲取數據用於自家模型的訓練。 它們似乎也沒有否定,還把幾個蒸餾模型掛在網上。但這不是竊取技術。說盜取數據,就準確多了,微軟和open AI就是怎麼說的。 重點是,利用蒸餾數據訓練並不是DeepSeek 取得成功的關鍵。DeepSeek 之所以能夠後來居上,一鳴驚人,是因為兩項原創技術/算法: 一,在大模型構架 上,開發出Multi-Head latent Attention(MLA)和 MOE架構,優化網絡通訊路徑,訓練模型省時 省電省(算)力。 二, 在大模型“後訓練”上採用直接強化學習, 使得模型展示出更高的智能,在 數學 、編程和推理的表現上尤為突出。 這裡,第二項遠比第一項重要。省時省電省算力,當然好,但這些都是錢可以解決的。而”用錢可以解決的事都不是事”,這句話在AI 界更成立。 用錢不能解決,至少不能很快解決的是,如何迅速提高智能? 人工智能模型的最終比拼是其產品的智能高低。超級智能 叫ASI, 最高的無所不知的是Digital God (數碼神)。“得AI者得天下” 這個說法的終極意思應該是, “得數碼神者得天下”。 什麼意思?筆者兩年前的文章對此有解釋: “Digital God (DG), 就是像上帝一樣無所不知的人工智能。 人類知道的, DG知道;人類不知道的,DG也知道。DG 可望發現可科學,幫助人類解決重大問題。 "比如說,如果問DG,怎樣獲得室溫常壓超導材料? 它可能會告訴你, 把什麼什麼材料按什麼什麼比例混合,在什麼溫度和什麼壓力下冶煉, 然後再怎麼怎麼淬火等等,可得室溫常壓超導材料。如此這般,世界上百多個凝聚態物理材料物理團隊幾十年來苦心孤詣而不得的材料,一舉得來。 "再比如說, 當地球人面臨危機時, 如何迅速逃離地球?馬斯克等人類想到的是坐飛船去火星。( 不可行, 太遠, 也不宜居)。 DG可能會告訴你,可以如此這般造一個蟲洞,從蟲洞走, 達到另一宇宙上的一個可居行星。 從蟲洞走, 逃離地球, 搞得好只有一步之遙,可以瞬間到達 。 ” 普通人看了這幾句話,一頭霧水,沒關係。如果中美政府高層和業界高層,沒聽說或者不明白這幾句話,可能會有嚴重後果。但是,據筆者所知,至少有一個人明白,他就是openAI的CEO 。筆者看過他兩年來訪談節目,知道他的目標是DG, AI 的星辰大海。
|