发表评论-老字号-万维博客-万维读者网（电脑版）

设万维读者为首页

万维读者网 -- 全球华人的精神家园

广告服务

联系我们

关于万维

首　页

新　闻

视　频

博　客

论　坛

分类广告

购　物


老字号的博客
自爱和尊重
	https://blog.creaders.net/u/13482/ > 复制 > 收藏本页

我的名片

老字号

注册日期: 2017-12-16
访问总量: 300,830 次

· 怎样把FBI警告的中文骗子电话封

· 磁共振成像造影剂中的金属可能导

· The DS, Deep Sip, Who Knows?

· 高价值豪宅烧成灰烬的好莱坞名人

· 为什么 DeepSeek 的新 AI 模型认

· 何祚庥评项立刚

· 转发【为什么左翼知识分子不理解

【评论】

· The DS, Deep Sip, Who Knows?

· 高价值豪宅烧成灰烬的好莱坞名人

· 为什么 DeepSeek 的新 AI 模型认

12/01/2025 - 12/31/2025

11/01/2025 - 11/30/2025

01/01/2025 - 01/31/2025

12/01/2024 - 12/31/2024

11/01/2024 - 11/30/2024

10/01/2024 - 10/31/2024

09/01/2024 - 09/30/2024

07/01/2024 - 07/31/2024

06/01/2024 - 06/30/2024

05/01/2024 - 05/31/2024

04/01/2024 - 04/30/2024

03/01/2024 - 03/31/2024

02/01/2024 - 02/29/2024

01/01/2024 - 01/31/2024

11/01/2023 - 11/30/2023

05/01/2023 - 05/31/2023

04/01/2023 - 04/30/2023

02/01/2023 - 02/28/2023

08/01/2022 - 08/31/2022

11/01/2021 - 11/30/2021

08/01/2021 - 08/31/2021

07/01/2021 - 07/31/2021

05/01/2021 - 05/31/2021

04/01/2021 - 04/30/2021

02/01/2021 - 02/28/2021

01/01/2021 - 01/31/2021

10/01/2020 - 10/31/2020

09/01/2020 - 09/30/2020

08/01/2020 - 08/31/2020

06/01/2020 - 06/30/2020

05/01/2020 - 05/31/2020

03/01/2020 - 03/31/2020

02/01/2020 - 02/29/2020

01/01/2020 - 01/31/2020

12/01/2019 - 12/31/2019

10/01/2019 - 10/31/2019

07/01/2019 - 07/31/2019

发表评论

敬告：您的浏览器已关闭活动脚本，开启后才可正常使用！

作者：

用户名：

密码：

您还不是博客/论坛用户？现在就注册！

评论：

为什么 DeepSeek 的新 AI 模型认为自己是 ChatGPT

为什么 DeepSeek 的新 AI 模型认为自己是 ChatGPT

Kyle Wiggers

2024 年 12 月 27 日

本周早些时候，资金雄厚的中国 AI 实验室 DeepSeek 发布了一款“开放”AI 模型，在热门基准测试中击败了许多竞争对手。该模型 DeepSeek V3 规模庞大但效率高，可以轻松处理基于文本的任务，例如编码和撰写论文。

它似乎也认为自己是 ChatGPT。

X 上的帖子——以及 TechCrunch 自己的测试——表明 DeepSeek V3 将自己标识为 ChatGPT，这是 OpenAI 的 AI 聊天机器人平台。当被要求详细说明时，DeepSeek V3 坚称它是 OpenAI 于 2023 年发布的 GPT-4 模型的一个版本。

这种妄想根深蒂固。如果您向 DeepSeek V3 询问有关 DeepSeek API 的问题，它会为您提供有关如何使用 OpenAI API 的说明。 DeepSeek V3 甚至讲了一些与 GPT-4 相同的笑话——甚至包括笑点。

那么发生了什么？

ChatGPT 和 DeepSeek V3 等模型是统计系统。经过数十亿个示例的训练，它们会从这些示例中学习模式以进行预测——例如，电子邮件中的“致谁”通常位于“可能相关”之前。

DeepSeek 并未透露太多有关 DeepSeek V3 训练数据来源的信息。但包含由 GPT-4 通过 ChatGPT 生成的文本的公共数据集并不缺乏。如果 DeepSeek V3 在这些数据集上进行训练，该模型可能会记住 GPT-4 的一些输出，现在正在逐字逐句地复述它们。

伦敦国王学院专门研究人工智能的研究员 Mike Cook 告诉 TechCrunch：“显然，该模型在某个时候看到了来自 ChatGPT 的原始回复，但不清楚那是在哪里。” “这可能是‘偶然’……但不幸的是，我们已经看到有人直接用其他模型的输出来训练他们的模型，试图利用他们的知识。”

库克指出，用竞争对手的人工智能系统的输出来训练模型的做法对模型质量“非常不利”，因为它会导致幻觉和误导性答案，如上文所述。“就像复印一份复印件一样，我们会失去越来越多的信息和与现实的联系，”库克说。

这也可能违反这些系统的服务条款。

OpenAI 的条款禁止其产品的用户（包括 ChatGPT 客户）使用输出来开发与 OpenAI 自己的模型竞争的模型。

OpenAI 和 DeepSeek 没有立即回应置评请求。然而，OpenAI 首席执行官 Sam Altman 在 X Friday 发布了一篇似乎是在挖苦 DeepSeek 和其他竞争对手的文章。

“复制你知道有效的东西（相对）容易，”Altman 写道。 “当你不知道某件新事物是否可行时，做它就极其困难。”

诚然，DeepSeek V3 远非第一个自我识别错误的模型。谷歌的 Gemini 和其他模型有时声称自己是竞争对手。例如，在普通话提示下，Gemini 说它是中国公司百度的 Wenxinyiyan 聊天机器人。

这是因为网络（AI 公司从中获取大量训练数据的地方）正充斥着 AI 垃圾。内容农场正在使用 AI 来创建点击诱饵。机器人充斥着 Reddit 和 X。据估计，到 2026 年，90% 的网络可能都是 AI 生成的。

这种“污染”，如果你愿意的话，已经使得从训练数据集中彻底过滤 AI 输出变得相当困难。

DeepSeek 直接在 ChatGPT 生成的文本上训练 DeepSeek V3 是完全有可能的。毕竟，谷歌曾经被指控做过同样的事情。

非营利组织 AI Now Institute 的首席 AI 科学家 Heidy Khlaaf 表示，无论风险如何，“提炼”现有模型知识所带来的成本节省对开发人员来说都是有吸引力的。

“即使现在互联网数据充斥着 AI 输出，其他意外地在 ChatGPT 或 GPT-4 输出上进行训练的模型也不一定能展示出让人联想到 OpenAI 定制消息的输出，”Khlaaf 说。“如果 DeepSeek 部分使用 OpenAI 模型进行提炼，那就不足为奇了。”

然而，更有可能的是，大量 ChatGPT/GPT-4 数据进入了 DeepSeek V3 训练集。这意味着该模型不能被信任进行自我识别。但更令人担忧的是，DeepSeek V3 可能会通过不加批判地吸收和迭代 GPT-4 的输出，加剧该模型的一些偏见和缺陷。

TechCrunch 有一份以 AI 为重点的新闻通讯！在此处注册，每周三在您的收件箱中收到它。

本文最初发表于 TechCrunch，网址为 https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/