設萬維讀者為首頁 萬維讀者網 -- 全球華人的精神家園 廣告服務 聯繫我們 關於萬維
 
首  頁 新  聞 視  頻 博  客 論  壇 分類廣告 購  物
搜索>> 發表日誌 控制面板 個人相冊 給我留言
幫助 退出
     
  拿破崙的博客
  追求真相, 匡扶正義
網絡日誌正文
幾句話談DeepSeek 2025-01-28 08:19:58

幾句話談DeepSeek


沙河


科技研發就像走迷宮,一路過去有許多分岔。每個分叉口有多個選擇: 左拐,右拐,後退或其它。


大概可以這麼說,在AI 大模型研發迷宮路徑的一個分叉口上,目前所有AI公司都跟它們的先行者,openAI一樣往左拐。只有DeepSeek 選擇了 右拐。結果發現,向右拐才是捷徑(至少目前看來是)。


左拐,在這裡是指在大模型後訓練中使用監督學習微調;  右拐,採用純強化學習。


Deep Seek另闢蹊徑,右拐,可能因為強化學習是它們的強項。而多年前,openAI 沒有右拐,可能因為當時強化學習才出來不久,他們還沒有掌握這一技術。


強化學習源於優化算法中的動態規劃(dynamic programming)。AI的 強化學習就是讓大模型神經網絡根據動態規劃的算法不斷更新參數。


通過強化學習可以培養AI 大模型的推理能力,掌握用數學方程表述的人類知識(在這之前AI 學會的都是用文字表述的人類知識), 比如廣義相對論,量子力學等等。筆者過去一、二年裡就多次建議中國AI ,特別是AGI, ASI 的研發者,關注強化學習。


但是強化學習/動態規劃有點難。 它在計算機算法的教科書裡是靠後的,許多未來的馬工沒學明白就翻過去了。在人工智能機器學習的教科書裡,老的沒有強化學習,新的也是靠後。


對強化學習/動態規劃的技術掌握最好的包括從事計算金融/量化金融的研發人員,他們開發的量化交易模型幾乎都是基於動態規劃。(掌握強化學習動態規劃技術的還包括從事軍工研發,比如導彈火箭衛星的技術人員。前幾年在車禍中去世的一個被稱為軍中頂尖人工智能專家的,就曾經在哈佛進修過強化學習)。


DeepSeek團隊從量化金融算法的研發轉過來,強化學習是他們的看家本領, 運用於AI 大模型更是輕車熟路。所以他們後來居上,一鳴驚人,是在意料之中。DeepSeek的成就是實質性的突破,說可比當年蘇聯的Sputnik衛星並不為過。說他們的模型是套殼的,是剽竊的,是外行話。




瀏覽(1539) (6) 評論(2)
發表評論
文章評論
作者:拿破崙 回復 牆內真相 留言時間:2025-01-29 05:20:24

不奇怪。人類社會,少不了噪聲。

回復 | 0
作者:牆內真相 留言時間:2025-01-28 10:56:04

你說不是就不是?輪子,民逗,1450都說是抄襲剽竊。

回復 | 0
我的名片
拿破崙
註冊日期: 2024-10-12
訪問總量: 627,638 次
點擊查看我的個人資料
Calendar
最新發布
· A I大吃一驚,自行標註中國青年
· 什麼是國寶? 誰是國寶?
· 川普為何拒絕馬查多
· AI 評論胡錦濤李克強胡春華
· 中青報匪徒阿妞不牛又在裝神弄鬼
· 至高無上的主,萬有的主宰:
· 一個健康的社會不應該只有一種聲
分類目錄
【哈佛博士事件真相】
· 精神狀況的問題是老畜牲"阿
· 報告中共中央決策議事協調機構:
· 中青報匪徒如果無辜,這麼被罵是
· AI: 敦促“阿妞不牛”等中國青年
· 路透社: 德國政府庇護中國頂尖人
· 李克強猝死前後的一些事
· 陳琳和哈佛博士事件(極簡版)
· 什麼是“哈佛博士案”?
· 一個被封殺二十多年的故事
· 簡單分析哈佛博士案的主要“報道”
【關於李克強】
· 報告中共中央決策議事協調機構:
· 2023年10月,李克強“自斃”於游泳
· 李克強是“自斃”於上海東郊賓館游
【關於團派/共青團】
· 魚目不可混珠
· 一個痴呆困於輪椅,一個“自斃”於
· 拒絕“先王”與“廢太子”, 回歸現
【報告中共中央】
· 致中共中央決策議事協調機構:
· 報告中共中央決策議事協調機構:
· 報告中共中央決策議事協調機構:
· 報告中共中央決策議事協調機構:
· 報告中共中央決策議事協調機構:
【陳琳博士】
· 什麼是國寶? 誰是國寶?
· 沙皇: 從川普拒絕馬查多談起
· 禮拜天禱告詞(更新版)
· 才學和顏值都是內稟屬性
· 民國大師和當代學者
· 哈佛大學的兩任校長
· 路透社: 德國政府庇護中國頂尖人
· 陳琳軼事:“無法靠近朱鎔基,信
· AI 評論:“ 中華第一才子”: 趙
· “一場思想深刻、視野開闊且極具
【人工智能】
· 中國AI 大廠要警惕“中國青年報”
· 全網第一個從專業角度肯定DeepSe
· 諾貝爾獎和中國的AI
· 從DeepSeek 竊取美國技術的指控
· 幾句話談DeepSeek
· 陳琳關於學術發展趨勢的演講
· 聊幾句AGI
【駁斥"阿妞不牛"】
· 中青報匪徒阿妞不牛又在裝神弄鬼
· 中國青年報匪徒: 不如畜生,惡
· 阿妞怕了,坐不住了。
· 阿妞污衊陳博士是“廢柴”、“精神
· 中青報匪徒阿妞不牛, 寫了很多
· 幾句話駁斥中青報匪徒“阿妞不牛”
· 阿妞不牛這是老年痴呆,還是故意
· 罪過啊,“哈佛博士”是恐怖組織的
· 萬維網的中青報匪徒暴露後,留園
· 再駁中青報匪徒“阿妞不牛”的謊言
【雜談】
· A I大吃一驚,自行標註中國青年
· 川普為何拒絕馬查多
· AI 評論胡錦濤李克強胡春華
· 至高無上的主,萬有的主宰:
· 一個健康的社會不應該只有一種聲
· 美國ICE殺人是失誤,中國共青團
· 阿妞不牛和它的同夥應該被碎屍萬
· 沙皇: 從川普拒絕馬查多談起
· 五塊墓碑和Shanechen 得有多蠢
· 團派餘孽的末路春夢
【中國青年報的罪惡】
· 澳洲恐怖分子和中國恐怖分子
· 報告中共中央決策議事協調機構:
· 專注造謠誹謗、男盜女娼、殺人越
· 致中共中央決策議事協調機構: 衛
· 中國青年報匪徒: 不如畜生,惡
· 一個被封殺二十多年的故事
· 千里之堤, 潰於蟻穴?(三則)
· 共青團中青報不滅,中國的災難不
· 請澳洲亞洲歐洲非洲美洲兄弟姊妹
· 習近平時代的中國科技(二則)
存檔目錄
2026-01-01 - 2026-01-14
2025-12-02 - 2025-12-31
2025-11-01 - 2025-11-30
2025-10-01 - 2025-10-31
2025-09-01 - 2025-09-30
2025-08-01 - 2025-08-30
2025-07-01 - 2025-07-31
2025-06-01 - 2025-06-30
2025-05-01 - 2025-05-30
2025-04-01 - 2025-04-30
2025-03-01 - 2025-03-31
2025-02-01 - 2025-02-28
2025-01-01 - 2025-01-31
2024-12-01 - 2024-12-30
2024-11-01 - 2024-11-29
2024-10-16 - 2024-10-31
 
關於本站 | 廣告服務 | 聯繫我們 | 招聘信息 | 網站導航 | 隱私保護
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.