設萬維讀者為首頁 萬維讀者網 -- 全球華人的精神家園 廣告服務 聯繫我們 關於萬維
 
首  頁 新  聞 視  頻 博  客 論  壇 分類廣告 購  物
搜索>> 發表日誌 控制面板 個人相冊 給我留言
幫助 退出
     
  拿破崙的博客
  追求真相, 匡扶正義
網絡日誌正文
幾句話談DeepSeek 2025-01-28 08:19:58

幾句話談DeepSeek


沙河


科技研發就像走迷宮,一路過去有許多分岔。每個分叉口有多個選擇: 左拐,右拐,後退或其它。


大概可以這麼說,在AI 大模型研發迷宮路徑的一個分叉口上,目前所有AI公司都跟它們的先行者,openAI一樣往左拐。只有DeepSeek 選擇了 右拐。結果發現,向右拐才是捷徑(至少目前看來是)。


左拐,在這裡是指在大模型後訓練中使用監督學習微調;  右拐,採用純強化學習。


Deep Seek另闢蹊徑,右拐,可能因為強化學習是它們的強項。而多年前,openAI 沒有右拐,可能因為當時強化學習才出來不久,他們還沒有掌握這一技術。


強化學習源於優化算法中的動態規劃(dynamic programming)。AI的 強化學習就是讓大模型神經網絡根據動態規劃的算法不斷更新參數。


通過強化學習可以培養AI 大模型的推理能力,掌握用數學方程表述的人類知識(在這之前AI 學會的都是用文字表述的人類知識), 比如廣義相對論,量子力學等等。筆者過去一、二年裡就多次建議中國AI ,特別是AGI, ASI 的研發者,關注強化學習。


但是強化學習/動態規劃有點難。 它在計算機算法的教科書裡是靠後的,許多未來的馬工沒學明白就翻過去了。在人工智能機器學習的教科書裡,老的沒有強化學習,新的也是靠後。


對強化學習/動態規劃的技術掌握最好的包括從事計算金融/量化金融的研發人員,他們開發的量化交易模型幾乎都是基於動態規劃。(掌握強化學習動態規劃技術的還包括從事軍工研發,比如導彈火箭衛星的技術人員。前幾年在車禍中去世的一個被稱為軍中頂尖人工智能專家的,就曾經在哈佛進修過強化學習)。


DeepSeek團隊從量化金融算法的研發轉過來,強化學習是他們的看家本領, 運用於AI 大模型更是輕車熟路。所以他們後來居上,一鳴驚人,是在意料之中。DeepSeek的成就是實質性的突破,說可比當年蘇聯的Sputnik衛星並不為過。說他們的模型是套殼的,是剽竊的,是外行話。




瀏覽(1387) (6) 評論(2)
發表評論
文章評論
作者:拿破崙 回復 牆內真相 留言時間:2025-01-29 05:20:24

不奇怪。人類社會,少不了噪聲。

回復 | 0
作者:牆內真相 留言時間:2025-01-28 10:56:04

你說不是就不是?輪子,民逗,1450都說是抄襲剽竊。

回復 | 0
我的名片
拿破崙
註冊日期: 2024-10-12
訪問總量: 519,770 次
點擊查看我的個人資料
Calendar
最新發布
· 碰瓷李克強 還是碰瓷“哈佛博士”
· 才學和顏值都是內稟屬性
· 千里之堤, 潰於蟻穴?(二則)
· 共青團中青報不滅,中國的災難不
· 請澳洲亞洲歐洲非洲美洲兄弟姊妹
· 習近平時代的中國科技(二則)
· 天雅這見識,是混 Chinatown的吧
分類目錄
【雜談】
· 才學和顏值都是內稟屬性
· 共青團中青報不滅,中國的災難不
· 天雅這見識,是混 Chinatown的吧
· 美聯儲主席人選
· 也談廢話
· 習近平“自我革命”第一刀:問斬共
· 阿妞怕了,坐不住了。
· 哈佛在中國受辱,
· 禮拜天禱告詞
· 中青報匪徒阿妞不牛, 寫了很多
【哈佛博士案】
· 碰瓷李克強 還是碰瓷“哈佛博士”
· 千里之堤, 潰於蟻穴?(二則)
· 請澳洲亞洲歐洲非洲美洲兄弟姊妹
· 習近平時代的中國科技(二則)
· 也談領袖的個人魅力
· 不如晚清?那是因為共青團中青報
· 一脈相承的造謠詐騙(外二則)
· 阿妞污衊陳博士是“廢柴”、“精神
· 節假日,不要忘記國家的敵人
· 再談“中國青年報”是恐怖組織
存檔目錄
2025-12-02 - 2025-12-08
2025-11-01 - 2025-11-30
2025-10-01 - 2025-10-31
2025-09-01 - 2025-09-30
2025-08-01 - 2025-08-30
2025-07-01 - 2025-07-31
2025-06-01 - 2025-06-30
2025-05-01 - 2025-05-30
2025-04-01 - 2025-04-30
2025-03-01 - 2025-03-31
2025-02-01 - 2025-02-28
2025-01-01 - 2025-01-31
2024-12-01 - 2024-12-30
2024-11-01 - 2024-11-29
2024-10-16 - 2024-10-31
 
關於本站 | 廣告服務 | 聯繫我們 | 招聘信息 | 網站導航 | 隱私保護
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.