為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT-老字號-萬維博客-萬維讀者網（電腦版）

網絡日誌正文

		為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT	2025-01-04 06:39:56

為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT

Kyle Wiggers

2024 年 12 月 27 日

本周早些時候，資金雄厚的中國 AI 實驗室 DeepSeek 發布了一款“開放”AI 模型，在熱門基準測試中擊敗了許多競爭對手。該模型 DeepSeek V3 規模龐大但效率高，可以輕鬆處理基於文本的任務，例如編碼和撰寫論文。

它似乎也認為自己是 ChatGPT。

X 上的帖子——以及 TechCrunch 自己的測試——表明 DeepSeek V3 將自己標識為 ChatGPT，這是 OpenAI 的 AI 聊天機器人平台。當被要求詳細說明時，DeepSeek V3 堅稱它是 OpenAI 於 2023 年發布的 GPT-4 模型的一個版本。

這種妄想根深蒂固。如果您向 DeepSeek V3 詢問有關 DeepSeek API 的問題，它會為您提供有關如何使用 OpenAI API 的說明。 DeepSeek V3 甚至講了一些與 GPT-4 相同的笑話——甚至包括笑點。

那麼發生了什麼？

ChatGPT 和 DeepSeek V3 等模型是統計系統。經過數十億個示例的訓練，它們會從這些示例中學習模式以進行預測——例如，電子郵件中的“致誰”通常位於“可能相關”之前。

DeepSeek 並未透露太多有關 DeepSeek V3 訓練數據來源的信息。但包含由 GPT-4 通過 ChatGPT 生成的文本的公共數據集並不缺乏。如果 DeepSeek V3 在這些數據集上進行訓練，該模型可能會記住 GPT-4 的一些輸出，現在正在逐字逐句地複述它們。

倫敦國王學院專門研究人工智能的研究員 Mike Cook 告訴 TechCrunch：“顯然，該模型在某個時候看到了來自 ChatGPT 的原始回復，但不清楚那是在哪裡。” “這可能是‘偶然’……但不幸的是，我們已經看到有人直接用其他模型的輸出來訓練他們的模型，試圖利用他們的知識。”

庫克指出，用競爭對手的人工智能系統的輸出來訓練模型的做法對模型質量“非常不利”，因為它會導致幻覺和誤導性答案，如上文所述。“就像複印一份複印件一樣，我們會失去越來越多的信息和與現實的聯繫，”庫克說。

這也可能違反這些系統的服務條款。

OpenAI 的條款禁止其產品的用戶（包括 ChatGPT 客戶）使用輸出來開發與 OpenAI 自己的模型競爭的模型。

OpenAI 和 DeepSeek 沒有立即回應置評請求。然而，OpenAI 首席執行官 Sam Altman 在 X Friday 發布了一篇似乎是在挖苦 DeepSeek 和其他競爭對手的文章。

“複製你知道有效的東西（相對）容易，”Altman 寫道。 “當你不知道某件新事物是否可行時，做它就極其困難。”

誠然，DeepSeek V3 遠非第一個自我識別錯誤的模型。谷歌的 Gemini 和其他模型有時聲稱自己是競爭對手。例如，在普通話提示下，Gemini 說它是中國公司百度的 Wenxinyiyan 聊天機器人。

這是因為網絡（AI 公司從中獲取大量訓練數據的地方）正充斥着 AI 垃圾。內容農場正在使用 AI 來創建點擊誘餌。機器人充斥着 Reddit 和 X。據估計，到 2026 年，90% 的網絡可能都是 AI 生成的。

這種“污染”，如果你願意的話，已經使得從訓練數據集中徹底過濾 AI 輸出變得相當困難。

DeepSeek 直接在 ChatGPT 生成的文本上訓練 DeepSeek V3 是完全有可能的。畢竟，谷歌曾經被指控做過同樣的事情。

非營利組織 AI Now Institute 的首席 AI 科學家 Heidy Khlaaf 表示，無論風險如何，“提煉”現有模型知識所帶來的成本節省對開發人員來說都是有吸引力的。

“即使現在互聯網數據充斥着 AI 輸出，其他意外地在 ChatGPT 或 GPT-4 輸出上進行訓練的模型也不一定能展示出讓人聯想到 OpenAI 定製消息的輸出，”Khlaaf 說。“如果 DeepSeek 部分使用 OpenAI 模型進行提煉，那就不足為奇了。”

然而，更有可能的是，大量 ChatGPT/GPT-4 數據進入了 DeepSeek V3 訓練集。這意味着該模型不能被信任進行自我識別。但更令人擔憂的是，DeepSeek V3 可能會通過不加批判地吸收和迭代 GPT-4 的輸出，加劇該模型的一些偏見和缺陷。

TechCrunch 有一份以 AI 為重點的新聞通訊！在此處註冊，每周三在您的收件箱中收到它。

本文最初發表於 TechCrunch，網址為 https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/