设万维读者为首页 万维读者网 -- 全球华人的精神家园 广告服务 联系我们 关于万维
 
首  页 新  闻 视  频 博  客 论  坛 分类广告 购  物
搜索>> 发表日志 控制面板 个人相册 给我留言
帮助 退出
老字号的博客  
自爱和尊重  
https://blog.creaders.net/u/13482/ > 复制 > 收藏本页
网络日志正文
为什么 DeepSeek 的新 AI 模型认为自己是 ChatGPT 2025-01-04 06:39:56

为什么 DeepSeek 的新 AI 模型认为自己是 ChatGPT

Kyle Wiggers

2024 12 27

本周早些时候,资金雄厚的中国 AI 实验室 DeepSeek 发布了一款“开放”AI 模型,在热门基准测试中击败了许多竞争对手。该模型 DeepSeek V3 规模庞大但效率高,可以轻松处理基于文本的任务,例如编码和撰写论文。

它似乎也认为自己是 ChatGPT

X 上的帖子——以及 TechCrunch 自己的测试——表明 DeepSeek V3 将自己标识为 ChatGPT,这是 OpenAI AI 聊天机器人平台。当被要求详细说明时,DeepSeek V3 坚称它是 OpenAI 2023 年发布的 GPT-4 模型的一个版本。

 image.png

这种妄想根深蒂固。如果您向 DeepSeek V3 询问有关 DeepSeek API 的问题,它会为您提供有关如何使用 OpenAI API 的说明。 DeepSeek V3 甚至讲了一些与 GPT-4 相同的笑话——甚至包括笑点。

那么发生了什么?

ChatGPT DeepSeek V3 等模型是统计系统。经过数十亿个示例的训练,它们会从这些示例中学习模式以进行预测——例如,电子邮件中的“致谁”通常位于“可能相关”之前。

DeepSeek 并未透露太多有关 DeepSeek V3 训练数据来源的信息。但包含由 GPT-4 通过 ChatGPT 生成的文本的公共数据集并不缺乏。如果 DeepSeek V3 在这些数据集上进行训练,该模型可能会记住 GPT-4 的一些输出,现在正在逐字逐句地复述它们。

伦敦国王学院专门研究人工智能的研究员 Mike Cook 告诉 TechCrunch:“显然,该模型在某个时候看到了来自 ChatGPT 的原始回复,但不清楚那是在哪里。” “这可能是‘偶然’……但不幸的是,我们已经看到有人直接用其他模型的输出来训练他们的模型,试图利用他们的知识。”

库克指出,用竞争对手的人工智能系统的输出来训练模型的做法对模型质量“非常不利”,因为它会导致幻觉和误导性答案,如上文所述。“就像复印一份复印件一样,我们会失去越来越多的信息和与现实的联系,”库克说。

这也可能违反这些系统的服务条款。

OpenAI 的条款禁止其产品的用户(包括 ChatGPT 客户)使用输出来开发与 OpenAI 自己的模型竞争的模型。

OpenAI DeepSeek 没有立即回应置评请求。然而,OpenAI 首席执行官 Sam Altman X Friday 发布了一篇似乎是在挖苦 DeepSeek 和其他竞争对手的文章。

“复制你知道有效的东西(相对)容易,”Altman 写道。 “当你不知道某件新事物是否可行时,做它就极其困难。”

诚然,DeepSeek V3 远非第一个自我识别错误的模型。谷歌的 Gemini 和其他模型有时声称自己是竞争对手。例如,在普通话提示下,Gemini 说它是中国公司百度的 Wenxinyiyan 聊天机器人。

这是因为网络(AI 公司从中获取大量训练数据的地方)正充斥着 AI 垃圾。内容农场正在使用 AI 来创建点击诱饵。机器人充斥着 Reddit X。据估计,到 2026 年,90% 的网络可能都是 AI 生成的。

这种“污染”,如果你愿意的话,已经使得从训练数据集中彻底过滤 AI 输出变得相当困难。

DeepSeek 直接在 ChatGPT 生成的文本上训练 DeepSeek V3 是完全有可能的。毕竟,谷歌曾经被指控做过同样的事情。

非营利组织 AI Now Institute 的首席 AI 科学家 Heidy Khlaaf 表示,无论风险如何,“提炼”现有模型知识所带来的成本节省对开发人员来说都是有吸引力的。

“即使现在互联网数据充斥着 AI 输出,其他意外地在 ChatGPT GPT-4 输出上进行训练的模型也不一定能展示出让人联想到 OpenAI 定制消息的输出,”Khlaaf 说。“如果 DeepSeek 部分使用 OpenAI 模型进行提炼,那就不足为奇了。”

然而,更有可能的是,大量 ChatGPT/GPT-4 数据进入了 DeepSeek V3 训练集。这意味着该模型不能被信任进行自我识别。但更令人担忧的是,DeepSeek V3 可能会通过不加批判地吸收和迭代 GPT-4 的输出,加剧该模型的一些偏见和缺陷。

TechCrunch 有一份以 AI 为重点的新闻通讯!在此处注册,每周三在您的收件箱中收到它。

本文最初发表于 TechCrunch,网址为 https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/


浏览(707) (2) 评论(0)
发表评论
我的名片
老字号
注册日期: 2017-12-16
访问总量: 236,243 次
点击查看我的个人资料
Calendar
最新发布
· 高价值豪宅烧成灰烬的好莱坞名人
· 为什么 DeepSeek 的新 AI 模型认
· 何祚庥评项立刚
· 转发【为什么左翼知识分子不理解
· 回复【体育老师】的【你们骂我川
· 立此存照:极左和极右一个德行—
· 社安金交多少税的计算方法
分类目录
【评论】
· 高价值豪宅烧成灰烬的好莱坞名人
· 为什么 DeepSeek 的新 AI 模型认
· 何祚庥评项立刚
· 转发【为什么左翼知识分子不理解
· 回复【体育老师】的【你们骂我川
· 立此存照:极左和极右一个德行—
· 社安金交多少税的计算方法
· 自费全身核磁共振
· 八卦谈:中共第二十届三中全会的
· 北约对俄罗斯虚假信息的驳斥
存档目录
2025-01-04 - 2025-01-11
2024-12-17 - 2024-12-17
2024-11-08 - 2024-11-13
2024-10-26 - 2024-10-26
2024-09-29 - 2024-09-29
2024-07-13 - 2024-07-15
2024-06-04 - 2024-06-04
2024-05-25 - 2024-05-25
2024-04-02 - 2024-04-02
2024-03-30 - 2024-03-30
2024-02-17 - 2024-02-17
2024-01-22 - 2024-01-22
2023-11-11 - 2023-11-11
2023-05-29 - 2023-05-31
2023-04-09 - 2023-04-26
2023-02-18 - 2023-02-20
2022-08-07 - 2022-08-18
2021-11-18 - 2021-11-18
2021-08-04 - 2021-08-05
2021-07-14 - 2021-07-26
2021-05-01 - 2021-05-01
2021-04-04 - 2021-04-29
2021-02-11 - 2021-02-13
2021-01-31 - 2021-01-31
2020-10-12 - 2020-10-12
2020-08-10 - 2020-08-23
2020-05-04 - 2020-05-24
2020-03-01 - 2020-03-01
2020-02-01 - 2020-02-17
2020-01-19 - 2020-01-23
2019-12-01 - 2019-12-22
2019-10-06 - 2019-10-30
2019-07-04 - 2019-07-31
 
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.