设万维读者为首页 万维读者网 -- 全球华人的精神家园 广告服务 联系我们 关于万维
 
首  页 新  闻 视  频 博  客 论  坛 分类广告 购  物
搜索>> 发表日志 控制面板 个人相册 给我留言
帮助 退出
翰山的博客  
现在好像流行博客, 也建立一个, 以收取我在万维所发的小文。  
https://blog.creaders.net/u/862/ > 复制 > 收藏本页
网络日志正文
AI 几何,80%都出错 --- 一个AI的负面例子 2025-02-11 16:36:51

【前注】从去年底开始用AI,发现AI被吹的很高,其实非常不成熟。

【注】本文是我接触学习AI的系列文章之一,与最近热炒 深度搜索,无关。对于深度搜索,我个人觉得没有必要发言或评述。继“汉芯一号”,“厉害了我的国”,“5G”,“鸿蒙”,“新能源汽车”,之后,深度搜索,仅仅是又一个炒作,而且热度期应该很短,不予评论。

下面三篇文字作为一个现阶段对AI的认识:

AI 几何,80%都出错 --- 一个AI的负面例子

这篇文章,是我两周前(此文原发翰山网--2025.01.30,所以这个两周前是大概1月15日左右)的一次偶然操作,当时问AI一个命题,“寻找需要四步以上证明的几何题”。结果发现,80%给出的命题都漏洞百出。于是,有了本文的题目。可惜的是,当时我没有截图成文,等有了闲暇,要缀字成文时,发现AI并不能完全复制以前的搜索结果。即,我无法复制我以前得到的错误。

好在,有两个明显的错误,我还记得。

  • “三角形外接圆的圆心到三角形各边距离相等。”

  • “等腰三角形ABC,AB=AC,BC上中点为D红色,证明三角形BDC也是等腰三角形”。

其中第一个,还做过搜索关键词。

我把上面两个搜索,输入到以下6个AI助手,三个国外,三个国内,包括深度搜索。每个搜索下面,附带一个做图要求。这六个AI是:

  1. ChatGPT --- OPenAI 旗下 AI 智能助手

  2. Grok / X --- 马斯克

  3. Copilot | Microsoft 365 Copilot --- 微软

  4. 豆包 - 字节跳动旗下 AI 智能助手

  5. DeepSee 深度搜索

  6. 文心一言 --- 百度旗下 AI 智能助手


总结:


我把总结写在这里。

第一个命题:

  • “三角形外接圆的圆心到三角形各边距离相等。”

由于命题本身是错的,所有的证明全部是错的。只有豆包分辨出了这个错误:

  • 判断对错:该说法错误。三角形外接圆的圆心是三角形三边垂直平分线的交点,这个点到三角形三个顶点的距离相等,而不是到三角形各边距离相等。到三角形各边距离相等的点是三角形内切圆的圆心,即三角形三条角平分线的交点。

并给出了正确的证明。做图全部失败,或者不能做,或者错误。请看,基本上不着边际。


第二个命题:

  • “等腰三角形ABC,AB=AC,BC上中点为D红色,证明三角形BDC也是等腰三角形”。

全军覆没,没有一个给出正确答案,指出BDC是一条直线,根本不是三角形。作图,深度搜索 给出了基本靠谱的图示,包括演示出BDC在一条直线上。


总评分:不及格。对于中等复杂的几何证明,80%以上是错误的。


搜索“三角形外接圆的圆心到三角形各边距离相等。”

  • ChatGPT --- OPenAI 旗下 AI 智能助手








搜索“等腰三角形ABC,AB=AC,BC上中点为D红色,证明三角形BDC也是等腰三角形”。

  • ChatGPT --- OPenAI 旗下 AI 智能助手








浏览(3477) (3) 评论(9)
发表评论
文章评论
作者:翰山 留言时间:2025-02-12 15:48:09

从春节,元宵是哪天这个小小的测试题,各种AI的准确率也是不及格,错误为 80%。

回复 | 0
作者:翰山 留言时间:2025-02-12 15:46:44

顺便再回头看看国内热炒的 Deep Seek:结果很差:



问它,今年的元宵节,同样的问题问其他AI,它竟然不知道。
再问具体点,2025年的元宵节,它给出和马斯克的 Grok 2同样的错误,公历3月3日。不知道这个结果从何而来。由于和马斯克的一致,是不是存在抄袭或互相抄袭。大概马斯克抄袭的可能性很小,因为此前,他还不知道有一个 DeepSeek

回复 | 0
作者:翰山 留言时间:2025-02-12 15:42:07

微软的Copilot成功了:

回复 | 0
作者:翰山 留言时间:2025-02-12 15:41:28

刚刚查验了一下马斯克旗下的Grok 2,失败:


回复 | 0
作者:翰山 留言时间:2025-02-12 06:44:23

下图是电脑上的 Chat GPT,还是错的。应该是2月12日。

可见AI是多么不可靠,必须要有人来矫正。显然,作为大数据训练,至少CHat GPT是不够的。没有注意国产的AI。

回复 | 0
作者:翰山 留言时间:2025-02-12 06:42:54

回复 | 0
作者:翰山 留言时间:2025-02-12 06:37:19

下面这个时昨天的微信。问Chat GPT元宵节,第一给问题,还可以,但举例2023,正确。

再问“今年呢”,第一个错误,回答的是2024。无论公历农历,今年都和2024无关。

再问:今年是2025年。元宵节回答是错误的。

回复 | 0
作者:翰山 留言时间:2025-02-12 06:34:20

回复 | 0
作者:翰山 留言时间:2025-02-12 06:33:39

AI 是一个不可靠的工具,至少目前如此。有些可以得到正确答案,但是如果随机出题,很可能不对。今天在问春节时就闹了笑话,还不知道。元宵,还是不行。

回复 | 0
我的名片
翰山
注册日期: 2007-06-06
访问总量: 323,441 次
点击查看我的个人资料
Calendar
最新发布
· AI 几何,80%都出错 --- 一个AI
· 最近十年中国GDP占美国的比例,
· 融入AI
· 跟施化博帖:好人壞人
· 《全球化(三),中国已经处于后
· 中国与世界目前都处于一个稳定平
· 《全球化(二),进程与落入中等
分类目录
【评论】
· AI 几何,80%都出错 --- 一个AI
· 最近十年中国GDP占美国的比例,
· 融入AI
· 跟施化博帖:好人壞人
· 《全球化(三),中国已经处于后
· 中国与世界目前都处于一个稳定平
· 《全球化(二),进程与落入中等
· 世界上没有多少真相 --- 85.5.19
· 好帝国主义与坏帝国主义!
· 一个漂移气球的标志
存档目录
2025-02-11 - 2025-02-11
2025-01-22 - 2025-01-26
2024-12-24 - 2024-12-24
2024-05-18 - 2024-05-18
2024-01-18 - 2024-01-18
2023-11-04 - 2023-11-04
2023-06-10 - 2023-06-10
2023-03-11 - 2023-03-11
2023-02-19 - 2023-02-25
2022-11-13 - 2022-11-13
2022-09-05 - 2022-09-17
2022-07-24 - 2022-07-24
2022-06-04 - 2022-06-29
2022-04-24 - 2022-04-30
2021-09-25 - 2021-09-25
2021-05-15 - 2021-05-15
2021-03-22 - 2021-03-22
2021-01-09 - 2021-01-09
2020-10-25 - 2020-10-29
2020-08-09 - 2020-08-09
2020-07-03 - 2020-07-18
2020-05-04 - 2020-05-27
2020-04-04 - 2020-04-26
2020-03-15 - 2020-03-30
2020-02-01 - 2020-02-12
2020-01-31 - 2020-01-31
2013-03-09 - 2013-03-09
 
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.