设万维读者为首页 万维读者网 -- 全球华人的精神家园 广告服务 联系我们 关于万维
 
首  页 新  闻 视  频 博  客 论  坛 分类广告 购  物
搜索>> 发表日志 控制面板 个人相册 给我留言
帮助 退出
     
  拿破仑的博客
  追求真相, 匡扶正义
网络日志正文
几句话谈DeepSeek 2025-01-28 08:19:58

几句话谈DeepSeek


沙河


科技研发就像走迷宫,一路过去有许多分岔。每个分叉口有多个选择: 左拐,右拐,后退或其它。


大概可以这么说,在AI 大模型研发迷宫路径的一个分叉口上,目前所有AI公司都跟它们的先行者,openAI一样往左拐。只有DeepSeek 选择了 右拐。结果发现,向右拐才是捷径(至少目前看来是)。


左拐,在这里是指在大模型后训练中使用监督学习微调;  右拐,采用纯强化学习。


Deep Seek另辟蹊径,右拐,可能因为强化学习是它们的强项。而多年前,openAI 没有右拐,可能因为当时强化学习才出来不久,他们还没有掌握这一技术。


强化学习源于优化算法中的动态规划(dynamic programming)。AI的 强化学习就是让大模型神经网络根据动态规划的算法不断更新参数。


通过强化学习可以培养AI 大模型的推理能力,掌握用数学方程表述的人类知识(在这之前AI 学会的都是用文字表述的人类知识), 比如广义相对论,量子力学等等。笔者过去一、二年里就多次建议中国AI ,特别是AGI, ASI 的研发者,关注强化学习。


但是强化学习/动态规划有点难。 它在计算机算法的教科书里是靠后的,许多未来的马工没学明白就翻过去了。在人工智能机器学习的教科书里,老的没有强化学习,新的也是靠后。


对强化学习/动态规划的技术掌握最好的包括从事计算金融/量化金融的研发人员,他们开发的量化交易模型几乎都是基于动态规划。(掌握强化学习动态规划技术的还包括从事军工研发,比如导弹火箭卫星的技术人员。前几年在车祸中去世的一个被称为军中顶尖人工智能专家的,就曾经在哈佛进修过强化学习)。


DeepSeek团队从量化金融算法的研发转过来,强化学习是他们的看家本领, 运用于AI 大模型更是轻车熟路。所以他们后来居上,一鸣惊人,是在意料之中。DeepSeek的成就是实质性的突破,说可比当年苏联的Sputnik卫星并不为过。说他们的模型是套壳的,是剽窃的,是外行话。




浏览(1429) (6) 评论(2)
发表评论
文章评论
作者:拿破仑 回复 墙内真相 留言时间:2025-01-29 05:20:24

不奇怪。人类社会,少不了噪声。

回复 | 0
作者:墙内真相 留言时间:2025-01-28 10:56:04

你说不是就不是?轮子,民逗,1450都说是抄袭剽窃。

回复 | 0
我的名片
拿破仑
注册日期: 2024-10-12
访问总量: 543,182 次
点击查看我的个人资料
Calendar
最新发布
· 南博院和中青报: 斯文的罪恶
· 二进制是中国人发明的?
· 是团派无人?还是大汉无人?
· 礼拜天,为天理正义祈祷
· 从姜昆和朋友唱红歌谈起
· 报告中共中央决策议事协调机构:
· 下文被删,为什么? 因为真相伤
分类目录
【哈佛博士事件真相】
· 精神状况的问题是老畜牲"阿
· 报告中共中央决策议事协调机构:
· 中青报匪徒如果无辜,这么被骂是
· AI: 敦促“阿妞不牛”等中国青年
· 路透社: 德國政府庇護中國頂尖人
· 李克强猝死前后的一些事
· 陈琳和哈佛博士事件(极简版)
· 什么是“哈佛博士案”?
· 一个被封杀二十多年的故事
· 简单分析哈佛博士案的主要“报道”
【关于李克强】
· 报告中共中央决策议事协调机构:
· 2023年10月,李克强“自毙”于游泳
· 李克强是“自毙”于上海东郊宾馆游
【关于团派/共青团】
· 鱼目不可混珠
· 一个痴呆困于轮椅,一个“自毙”于
· 拒绝“先王”与“废太子”, 回归现
【报告中共中央】
· 致中共中央决策议事协调机构:
· 报告中共中央决策议事协调机构:
· 报告中共中央决策议事协调机构:
· 报告中共中央决策议事协调机构:
· 报告中共中央决策议事协调机构:
【陈琳博士】
· 礼拜天祷告词(更新版)
· 才学和颜值都是内禀属性
· 民国大师和当代学者
· 哈佛大学的两任校长
· 路透社: 德國政府庇護中國頂尖人
· 陈琳轶事:“无法靠近朱镕基,信
· AI 评论:“ 中华第一才子”: 赵
· “一场思想深刻、视野开阔且极具
· 第一个中国籍哈佛肯尼迪学院博士
· 中国近百年里,还有哪些非政府官
【人工智能】
· 中国AI 大厂要警惕“中国青年报”
· 全网第一个从专业角度肯定DeepSe
· 诺贝尔奖和中国的AI
· 从DeepSeek 窃取美国技术的指控
· 几句话谈DeepSeek
· 陈琳关于学术发展趋势的演讲
· 聊幾句AGI
【驳斥"阿妞不牛"】
· 中国青年报匪徒: 不如畜生,恶
· 阿妞怕了,坐不住了。
· 阿妞污蔑陈博士是“废柴”、“精神
· 中青报匪徒阿妞不牛, 写了很多
· 几句话驳斥中青报匪徒“阿妞不牛”
· 阿妞不牛这是老年痴呆,还是故意
· 罪过啊,“哈佛博士”是恐怖组织的
· 万维网的中青报匪徒暴露后,留园
· 再驳中青报匪徒“阿妞不牛”的谎言
· 批驳中青报匪徒阿妞不牛的谣言
【杂谈】
· 南博院和中青报: 斯文的罪恶
· 二进制是中国人发明的?
· 是团派无人?还是大汉无人?
· 礼拜天,为天理正义祈祷
· 从姜昆和朋友唱红歌谈起
· 报告中共中央决策议事协调机构:
· 下文被删,为什么? 因为真相伤
· 南博前院长被警察带走了,中青报
· 节日季,给中国青年报全体员工和
· 怎么可能? 这可是魔都的徐汇区,
【中国青年报的罪恶】
· 澳洲恐怖分子和中国恐怖分子
· 报告中共中央决策议事协调机构:
· 专注造谣诽谤、男盗女娼、杀人越
· 致中共中央决策议事协调机构: 卫
· 中国青年报匪徒: 不如畜生,恶
· 一个被封杀二十多年的故事
· 千里之堤, 溃于蚁穴?(三则)
· 共青团中青报不灭,中国的灾难不
· 请澳洲亚洲欧洲非洲美洲兄弟姊妹
· 习近平时代的中国科技(二则)
存档目录
2025-12-02 - 2025-12-30
2025-11-01 - 2025-11-30
2025-10-01 - 2025-10-31
2025-09-01 - 2025-09-30
2025-08-01 - 2025-08-30
2025-07-01 - 2025-07-31
2025-06-01 - 2025-06-30
2025-05-01 - 2025-05-30
2025-04-01 - 2025-04-30
2025-03-01 - 2025-03-31
2025-02-01 - 2025-02-28
2025-01-01 - 2025-01-31
2024-12-01 - 2024-12-30
2024-11-01 - 2024-11-29
2024-10-16 - 2024-10-31
 
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.