設萬維讀者為首頁 萬維讀者網 -- 全球華人的精神家園 廣告服務 聯繫我們 關於萬維
 
首  頁 新  聞 視  頻 博  客 論  壇 分類廣告 購  物
搜索>> 發表日誌 控制面板 個人相冊 給我留言
幫助 退出
老字號的博客  
自愛和尊重  
https://blog.creaders.net/u/13482/ > 複製 > 收藏本頁
網絡日誌正文
為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT 2025-01-04 06:39:56

為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT

Kyle Wiggers

2024 12 27

本周早些時候,資金雄厚的中國 AI 實驗室 DeepSeek 發布了一款“開放”AI 模型,在熱門基準測試中擊敗了許多競爭對手。該模型 DeepSeek V3 規模龐大但效率高,可以輕鬆處理基於文本的任務,例如編碼和撰寫論文。

它似乎也認為自己是 ChatGPT

X 上的帖子——以及 TechCrunch 自己的測試——表明 DeepSeek V3 將自己標識為 ChatGPT,這是 OpenAI AI 聊天機器人平台。當被要求詳細說明時,DeepSeek V3 堅稱它是 OpenAI 2023 年發布的 GPT-4 模型的一個版本。

 image.png

這種妄想根深蒂固。如果您向 DeepSeek V3 詢問有關 DeepSeek API 的問題,它會為您提供有關如何使用 OpenAI API 的說明。 DeepSeek V3 甚至講了一些與 GPT-4 相同的笑話——甚至包括笑點。

那麼發生了什麼?

ChatGPT DeepSeek V3 等模型是統計系統。經過數十億個示例的訓練,它們會從這些示例中學習模式以進行預測——例如,電子郵件中的“致誰”通常位於“可能相關”之前。

DeepSeek 並未透露太多有關 DeepSeek V3 訓練數據來源的信息。但包含由 GPT-4 通過 ChatGPT 生成的文本的公共數據集並不缺乏。如果 DeepSeek V3 在這些數據集上進行訓練,該模型可能會記住 GPT-4 的一些輸出,現在正在逐字逐句地複述它們。

倫敦國王學院專門研究人工智能的研究員 Mike Cook 告訴 TechCrunch:“顯然,該模型在某個時候看到了來自 ChatGPT 的原始回復,但不清楚那是在哪裡。” “這可能是‘偶然’……但不幸的是,我們已經看到有人直接用其他模型的輸出來訓練他們的模型,試圖利用他們的知識。”

庫克指出,用競爭對手的人工智能系統的輸出來訓練模型的做法對模型質量“非常不利”,因為它會導致幻覺和誤導性答案,如上文所述。“就像複印一份複印件一樣,我們會失去越來越多的信息和與現實的聯繫,”庫克說。

這也可能違反這些系統的服務條款。

OpenAI 的條款禁止其產品的用戶(包括 ChatGPT 客戶)使用輸出來開發與 OpenAI 自己的模型競爭的模型。

OpenAI DeepSeek 沒有立即回應置評請求。然而,OpenAI 首席執行官 Sam Altman X Friday 發布了一篇似乎是在挖苦 DeepSeek 和其他競爭對手的文章。

“複製你知道有效的東西(相對)容易,”Altman 寫道。 “當你不知道某件新事物是否可行時,做它就極其困難。”

誠然,DeepSeek V3 遠非第一個自我識別錯誤的模型。谷歌的 Gemini 和其他模型有時聲稱自己是競爭對手。例如,在普通話提示下,Gemini 說它是中國公司百度的 Wenxinyiyan 聊天機器人。

這是因為網絡(AI 公司從中獲取大量訓練數據的地方)正充斥着 AI 垃圾。內容農場正在使用 AI 來創建點擊誘餌。機器人充斥着 Reddit X。據估計,到 2026 年,90% 的網絡可能都是 AI 生成的。

這種“污染”,如果你願意的話,已經使得從訓練數據集中徹底過濾 AI 輸出變得相當困難。

DeepSeek 直接在 ChatGPT 生成的文本上訓練 DeepSeek V3 是完全有可能的。畢竟,谷歌曾經被指控做過同樣的事情。

非營利組織 AI Now Institute 的首席 AI 科學家 Heidy Khlaaf 表示,無論風險如何,“提煉”現有模型知識所帶來的成本節省對開發人員來說都是有吸引力的。

“即使現在互聯網數據充斥着 AI 輸出,其他意外地在 ChatGPT GPT-4 輸出上進行訓練的模型也不一定能展示出讓人聯想到 OpenAI 定製消息的輸出,”Khlaaf 說。“如果 DeepSeek 部分使用 OpenAI 模型進行提煉,那就不足為奇了。”

然而,更有可能的是,大量 ChatGPT/GPT-4 數據進入了 DeepSeek V3 訓練集。這意味着該模型不能被信任進行自我識別。但更令人擔憂的是,DeepSeek V3 可能會通過不加批判地吸收和迭代 GPT-4 的輸出,加劇該模型的一些偏見和缺陷。

TechCrunch 有一份以 AI 為重點的新聞通訊!在此處註冊,每周三在您的收件箱中收到它。

本文最初發表於 TechCrunch,網址為 https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/


瀏覽(3319) (6) 評論(0)
發表評論
我的名片
老字號
註冊日期: 2017-12-16
訪問總量: 284,886 次
點擊查看我的個人資料
Calendar
最新發布
· 怎樣把FBI警告的中文騙子電話封
· 磁共振成像造影劑中的金屬可能導
· The DS, Deep Sip, Who Knows?
· 高價值豪宅燒成灰燼的好萊塢名人
· 為什麼 DeepSeek 的新 AI 模型認
· 何祚庥評項立剛
· 轉發【為什麼左翼知識分子不理解
分類目錄
【評論】
· 怎樣把FBI警告的中文騙子電話封
· 磁共振成像造影劑中的金屬可能導
· The DS, Deep Sip, Who Knows?
· 高價值豪宅燒成灰燼的好萊塢名人
· 為什麼 DeepSeek 的新 AI 模型認
· 何祚庥評項立剛
· 轉發【為什麼左翼知識分子不理解
· 回復【體育老師】的【你們罵我川
· 立此存照:極左和極右一個德行—
· 社安金交多少稅的計算方法
存檔目錄
2025-12-05 - 2025-12-05
2025-11-28 - 2025-11-28
2025-01-04 - 2025-01-29
2024-12-17 - 2024-12-17
2024-11-08 - 2024-11-13
2024-10-26 - 2024-10-26
2024-09-29 - 2024-09-29
2024-07-13 - 2024-07-15
2024-06-04 - 2024-06-04
2024-05-25 - 2024-05-25
2024-04-02 - 2024-04-02
2024-03-30 - 2024-03-30
2024-02-17 - 2024-02-17
2024-01-22 - 2024-01-22
2023-11-11 - 2023-11-11
2023-05-29 - 2023-05-31
2023-04-09 - 2023-04-26
2023-02-18 - 2023-02-20
2022-08-07 - 2022-08-18
2021-11-18 - 2021-11-18
2021-08-04 - 2021-08-05
2021-07-14 - 2021-07-26
2021-05-01 - 2021-05-01
2021-04-04 - 2021-04-29
2021-02-11 - 2021-02-13
2021-01-31 - 2021-01-31
2020-10-12 - 2020-10-12
2020-08-10 - 2020-08-23
2020-05-04 - 2020-05-24
2020-03-01 - 2020-03-01
2020-02-01 - 2020-02-17
2020-01-19 - 2020-01-23
2019-12-01 - 2019-12-22
2019-10-06 - 2019-10-30
2019-07-04 - 2019-07-31
 
關於本站 | 廣告服務 | 聯繫我們 | 招聘信息 | 網站導航 | 隱私保護
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.