設萬維讀者為首頁 萬維讀者網 -- 全球華人的精神家園 廣告服務 聯繫我們 關於萬維
 
首  頁 新  聞 視  頻 博  客 論  壇 分類廣告 購  物
搜索>> 發表日誌 控制面板 個人相冊 給我留言
幫助 退出
翰山的博客  
現在好像流行博客, 也建立一個, 以收取我在萬維所發的小文。  
https://blog.creaders.net/u/862/ > 複製 > 收藏本頁
網絡日誌正文
AI 幾何,80%都出錯 --- 一個AI的負面例子 2025-02-11 16:36:51

【前注】從去年底開始用AI,發現AI被吹的很高,其實非常不成熟。

【注】本文是我接觸學習AI的系列文章之一,與最近熱炒 深度搜索,無關。對於深度搜索,我個人覺得沒有必要發言或評述。繼“漢芯一號”,“厲害了我的國”,“5G”,“鴻蒙”,“新能源汽車”,之後,深度搜索,僅僅是又一個炒作,而且熱度期應該很短,不予評論。

下面三篇文字作為一個現階段對AI的認識:

AI 幾何,80%都出錯 --- 一個AI的負面例子

這篇文章,是我兩周前(此文原發翰山網--2025.01.30,所以這個兩周前是大概1月15日左右)的一次偶然操作,當時問AI一個命題,“尋找需要四步以上證明的幾何題”。結果發現,80%給出的命題都漏洞百出。於是,有了本文的題目。可惜的是,當時我沒有截圖成文,等有了閒暇,要綴字成文時,發現AI並不能完全複製以前的搜索結果。即,我無法複製我以前得到的錯誤。

好在,有兩個明顯的錯誤,我還記得。

  • “三角形外接圓的圓心到三角形各邊距離相等。”

  • “等腰三角形ABC,AB=AC,BC上中點為D紅色,證明三角形BDC也是等腰三角形”。

其中第一個,還做過搜索關鍵詞。

我把上面兩個搜索,輸入到以下6個AI助手,三個國外,三個國內,包括深度搜索。每個搜索下面,附帶一個做圖要求。這六個AI是:

  1. ChatGPT --- OPenAI 旗下 AI 智能助手

  2. Grok / X --- 馬斯克

  3. Copilot | Microsoft 365 Copilot --- 微軟

  4. 豆包 - 字節跳動旗下 AI 智能助手

  5. DeepSee 深度搜索

  6. 文心一言 --- 百度旗下 AI 智能助手


總結:


我把總結寫在這裡。

第一個命題:

  • “三角形外接圓的圓心到三角形各邊距離相等。”

由於命題本身是錯的,所有的證明全部是錯的。只有豆包分辨出了這個錯誤:

  • 判斷對錯:該說法錯誤。三角形外接圓的圓心是三角形三邊垂直平分線的交點,這個點到三角形三個頂點的距離相等,而不是到三角形各邊距離相等。到三角形各邊距離相等的點是三角形內切圓的圓心,即三角形三條角平分線的交點。

並給出了正確的證明。做圖全部失敗,或者不能做,或者錯誤。請看,基本上不着邊際。


第二個命題:

  • “等腰三角形ABC,AB=AC,BC上中點為D紅色,證明三角形BDC也是等腰三角形”。

全軍覆沒,沒有一個給出正確答案,指出BDC是一條直線,根本不是三角形。作圖,深度搜索 給出了基本靠譜的圖示,包括演示出BDC在一條直線上。


總評分:不及格。對於中等複雜的幾何證明,80%以上是錯誤的。


搜索“三角形外接圓的圓心到三角形各邊距離相等。”

  • ChatGPT --- OPenAI 旗下 AI 智能助手








搜索“等腰三角形ABC,AB=AC,BC上中點為D紅色,證明三角形BDC也是等腰三角形”。

  • ChatGPT --- OPenAI 旗下 AI 智能助手








瀏覽(4872) (3) 評論(9)
發表評論
文章評論
作者:翰山 留言時間:2025-02-12 15:48:09

從春節,元宵是哪天這個小小的測試題,各種AI的準確率也是不及格,錯誤為 80%。

回復 | 0
作者:翰山 留言時間:2025-02-12 15:46:44

順便再回頭看看國內熱炒的 Deep Seek:結果很差:



問它,今年的元宵節,同樣的問題問其他AI,它竟然不知道。
再問具體點,2025年的元宵節,它給出和馬斯克的 Grok 2同樣的錯誤,公曆3月3日。不知道這個結果從何而來。由於和馬斯克的一致,是不是存在抄襲或互相抄襲。大概馬斯克抄襲的可能性很小,因為此前,他還不知道有一個 DeepSeek

回復 | 0
作者:翰山 留言時間:2025-02-12 15:42:07

微軟的Copilot成功了:

回復 | 0
作者:翰山 留言時間:2025-02-12 15:41:28

剛剛查驗了一下馬斯克旗下的Grok 2,失敗:


回復 | 0
作者:翰山 留言時間:2025-02-12 06:44:23

下圖是電腦上的 Chat GPT,還是錯的。應該是2月12日。

可見AI是多麼不可靠,必須要有人來矯正。顯然,作為大數據訓練,至少CHat GPT是不夠的。沒有注意國產的AI。

回復 | 0
作者:翰山 留言時間:2025-02-12 06:42:54

回復 | 0
作者:翰山 留言時間:2025-02-12 06:37:19

下面這個時昨天的微信。問Chat GPT元宵節,第一給問題,還可以,但舉例2023,正確。

再問“今年呢”,第一個錯誤,回答的是2024。無論公曆農曆,今年都和2024無關。

再問:今年是2025年。元宵節回答是錯誤的。

回復 | 0
作者:翰山 留言時間:2025-02-12 06:34:20

回復 | 0
作者:翰山 留言時間:2025-02-12 06:33:39

AI 是一個不可靠的工具,至少目前如此。有些可以得到正確答案,但是如果隨機出題,很可能不對。今天在問春節時就鬧了笑話,還不知道。元宵,還是不行。

回復 | 0
我的名片
翰山
註冊日期: 2007-06-06
訪問總量: 396,267 次
點擊查看我的個人資料
Calendar
最新發布
· 社會主義攻克了美國資本主義的老
· 日本2025年又獲兩枚諾貝爾獎,中
· 何衛東,苗華等九人,嚴重違紀違
· 傷筋動骨一百天
· Chat GPT5相對於Chat GPT1的進步
· 與Chat GPT5對話
· 買房是一種藝術享受(五)--- 收
分類目錄
【評論】
· 社會主義攻克了美國資本主義的老
· 日本2025年又獲兩枚諾貝爾獎,中
· 何衛東,苗華等九人,嚴重違紀違
· 傷筋動骨一百天
· Chat GPT5相對於Chat GPT1的進步
· 與Chat GPT5對話
· 買房是一種藝術享受(五)--- 收
· 買房是一種藝術享受(四)--- 第
· 買房是一種藝術享受(三)--- 第
· 買房是一種藝術享受(二)--- 第
存檔目錄
2025-11-15 - 2025-11-15
2025-10-05 - 2025-10-21
2025-08-22 - 2025-08-24
2025-05-03 - 2025-05-12
2025-04-07 - 2025-04-07
2025-02-11 - 2025-02-11
2025-01-22 - 2025-01-26
2024-12-24 - 2024-12-24
2024-05-18 - 2024-05-18
2024-01-18 - 2024-01-18
2023-11-04 - 2023-11-04
2023-06-10 - 2023-06-10
2023-03-11 - 2023-03-11
2023-02-19 - 2023-02-25
2022-11-13 - 2022-11-13
2022-09-05 - 2022-09-17
2022-07-24 - 2022-07-24
2022-06-04 - 2022-06-29
2022-04-24 - 2022-04-30
2021-09-25 - 2021-09-25
2021-05-15 - 2021-05-15
2021-03-22 - 2021-03-22
2021-01-09 - 2021-01-09
2020-10-25 - 2020-10-29
2020-08-09 - 2020-08-09
2020-07-03 - 2020-07-18
2020-05-04 - 2020-05-27
2020-04-04 - 2020-04-26
2020-03-15 - 2020-03-30
2020-02-01 - 2020-02-12
2020-01-31 - 2020-01-31
2013-03-09 - 2013-03-09
 
關於本站 | 廣告服務 | 聯繫我們 | 招聘信息 | 網站導航 | 隱私保護
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.