设万维读者为首页 万维读者网 -- 全球华人的精神家园 广告服务 联系我们 关于万维
 
首  页 新  闻 视  频 博  客 论  坛 分类广告 购  物
搜索>> 发表日志 控制面板 个人相册 给我留言
帮助 退出
老字号的博客  
自爱和尊重  
https://blog.creaders.net/u/13482/ > 复制 > 收藏本页
我的名片
老字号
注册日期: 2017-12-16
访问总量: 238,546 次
点击查看我的个人资料
Calendar
我的公告栏
最新发布
· 高价值豪宅烧成灰烬的好莱坞名人
· 为什么 DeepSeek 的新 AI 模型认
· 何祚庥评项立刚
· 转发【为什么左翼知识分子不理解
· 回复【体育老师】的【你们骂我川
· 立此存照:极左和极右一个德行—
· 社安金交多少税的计算方法
友好链接
分类目录
【评论】
· 高价值豪宅烧成灰烬的好莱坞名人
· 为什么 DeepSeek 的新 AI 模型认
· 何祚庥评项立刚
· 转发【为什么左翼知识分子不理解
· 回复【体育老师】的【你们骂我川
· 立此存照:极左和极右一个德行—
· 社安金交多少税的计算方法
· 自费全身核磁共振
· 八卦谈:中共第二十届三中全会的
· 北约对俄罗斯虚假信息的驳斥
存档目录
01/01/2025 - 01/31/2025
12/01/2024 - 12/31/2024
11/01/2024 - 11/30/2024
10/01/2024 - 10/31/2024
09/01/2024 - 09/30/2024
07/01/2024 - 07/31/2024
06/01/2024 - 06/30/2024
05/01/2024 - 05/31/2024
04/01/2024 - 04/30/2024
03/01/2024 - 03/31/2024
02/01/2024 - 02/29/2024
01/01/2024 - 01/31/2024
11/01/2023 - 11/30/2023
05/01/2023 - 05/31/2023
04/01/2023 - 04/30/2023
02/01/2023 - 02/28/2023
08/01/2022 - 08/31/2022
11/01/2021 - 11/30/2021
08/01/2021 - 08/31/2021
07/01/2021 - 07/31/2021
05/01/2021 - 05/31/2021
04/01/2021 - 04/30/2021
02/01/2021 - 02/28/2021
01/01/2021 - 01/31/2021
10/01/2020 - 10/31/2020
09/01/2020 - 09/30/2020
08/01/2020 - 08/31/2020
06/01/2020 - 06/30/2020
05/01/2020 - 05/31/2020
03/01/2020 - 03/31/2020
02/01/2020 - 02/29/2020
01/01/2020 - 01/31/2020
12/01/2019 - 12/31/2019
10/01/2019 - 10/31/2019
07/01/2019 - 07/31/2019
发表评论
作者:
用户名: 密码: 您还不是博客/论坛用户?现在就注册!
     
评论:
为什么 DeepSeek 的新 AI 模型认为自己是 ChatGPT
   

为什么 DeepSeek 的新 AI 模型认为自己是 ChatGPT

Kyle Wiggers

2024 12 27

本周早些时候,资金雄厚的中国 AI 实验室 DeepSeek 发布了一款“开放”AI 模型,在热门基准测试中击败了许多竞争对手。该模型 DeepSeek V3 规模庞大但效率高,可以轻松处理基于文本的任务,例如编码和撰写论文。

它似乎也认为自己是 ChatGPT

X 上的帖子——以及 TechCrunch 自己的测试——表明 DeepSeek V3 将自己标识为 ChatGPT,这是 OpenAI AI 聊天机器人平台。当被要求详细说明时,DeepSeek V3 坚称它是 OpenAI 2023 年发布的 GPT-4 模型的一个版本。

 image.png

这种妄想根深蒂固。如果您向 DeepSeek V3 询问有关 DeepSeek API 的问题,它会为您提供有关如何使用 OpenAI API 的说明。 DeepSeek V3 甚至讲了一些与 GPT-4 相同的笑话——甚至包括笑点。

那么发生了什么?

ChatGPT DeepSeek V3 等模型是统计系统。经过数十亿个示例的训练,它们会从这些示例中学习模式以进行预测——例如,电子邮件中的“致谁”通常位于“可能相关”之前。

DeepSeek 并未透露太多有关 DeepSeek V3 训练数据来源的信息。但包含由 GPT-4 通过 ChatGPT 生成的文本的公共数据集并不缺乏。如果 DeepSeek V3 在这些数据集上进行训练,该模型可能会记住 GPT-4 的一些输出,现在正在逐字逐句地复述它们。

伦敦国王学院专门研究人工智能的研究员 Mike Cook 告诉 TechCrunch:“显然,该模型在某个时候看到了来自 ChatGPT 的原始回复,但不清楚那是在哪里。” “这可能是‘偶然’……但不幸的是,我们已经看到有人直接用其他模型的输出来训练他们的模型,试图利用他们的知识。”

库克指出,用竞争对手的人工智能系统的输出来训练模型的做法对模型质量“非常不利”,因为它会导致幻觉和误导性答案,如上文所述。“就像复印一份复印件一样,我们会失去越来越多的信息和与现实的联系,”库克说。

这也可能违反这些系统的服务条款。

OpenAI 的条款禁止其产品的用户(包括 ChatGPT 客户)使用输出来开发与 OpenAI 自己的模型竞争的模型。

OpenAI DeepSeek 没有立即回应置评请求。然而,OpenAI 首席执行官 Sam Altman X Friday 发布了一篇似乎是在挖苦 DeepSeek 和其他竞争对手的文章。

“复制你知道有效的东西(相对)容易,”Altman 写道。 “当你不知道某件新事物是否可行时,做它就极其困难。”

诚然,DeepSeek V3 远非第一个自我识别错误的模型。谷歌的 Gemini 和其他模型有时声称自己是竞争对手。例如,在普通话提示下,Gemini 说它是中国公司百度的 Wenxinyiyan 聊天机器人。

这是因为网络(AI 公司从中获取大量训练数据的地方)正充斥着 AI 垃圾。内容农场正在使用 AI 来创建点击诱饵。机器人充斥着 Reddit X。据估计,到 2026 年,90% 的网络可能都是 AI 生成的。

这种“污染”,如果你愿意的话,已经使得从训练数据集中彻底过滤 AI 输出变得相当困难。

DeepSeek 直接在 ChatGPT 生成的文本上训练 DeepSeek V3 是完全有可能的。毕竟,谷歌曾经被指控做过同样的事情。

非营利组织 AI Now Institute 的首席 AI 科学家 Heidy Khlaaf 表示,无论风险如何,“提炼”现有模型知识所带来的成本节省对开发人员来说都是有吸引力的。

“即使现在互联网数据充斥着 AI 输出,其他意外地在 ChatGPT GPT-4 输出上进行训练的模型也不一定能展示出让人联想到 OpenAI 定制消息的输出,”Khlaaf 说。“如果 DeepSeek 部分使用 OpenAI 模型进行提炼,那就不足为奇了。”

然而,更有可能的是,大量 ChatGPT/GPT-4 数据进入了 DeepSeek V3 训练集。这意味着该模型不能被信任进行自我识别。但更令人担忧的是,DeepSeek V3 可能会通过不加批判地吸收和迭代 GPT-4 的输出,加剧该模型的一些偏见和缺陷。

TechCrunch 有一份以 AI 为重点的新闻通讯!在此处注册,每周三在您的收件箱中收到它。

本文最初发表于 TechCrunch,网址为 https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/


 
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.