設萬維讀者為首頁 萬維讀者網 -- 全球華人的精神家園 廣告服務 聯繫我們 關於萬維
 
首  頁 新  聞 視  頻 博  客 論  壇 分類廣告 購  物
搜索>> 發表日誌 控制面板 個人相冊 給我留言
幫助 退出
 
思蘆隨筆  
思想之蘆  
我的名片
思蘆
註冊日期: 2013-09-24
訪問總量: 3,022,091 次
點擊查看我的個人資料
Calendar
我的公告欄
本博客不歡迎滾刀肉
最新發布
· 四年前舊作:卷土才俊在江東
· 推薦一種新的Medicare保險
· 國家為何失敗,中國制度是優勢還
· 存在即合理?錯!黑格爾背了黑鍋
· 屋檐滴水(空調冷凝水)問題的解決
· 萊特灣海戰: 英勇小兵拯救四星上
· 退休生活:自己動手修空調
友好鏈接
· 阿妞不牛:阿妞不牛的博客
· 高伐林:老高的博客
· 四同:四同的博客
· 施化:施化的博客
· 山蛟龍:山蛟龍的博客
· 體育老師:體育老師的博客
· 席琳:席琳的博客
分類目錄
【深度觀察】
· 國家為何失敗,中國制度是優勢還
· 存在即合理?錯!黑格爾背了黑鍋
· 中國文化在外來文化侵略下,呈倒
· 評點中國與美國的奧運獎牌爭霸賽
· 用腳投票和用嘴投票
· 撕下中共執政的最後一塊合法性遮
· 評《西方為何領先》, 兼談東方為
· 愚蠢的國家戰略是如何出籠的?
· 中俄列名政權殺人最多,對世界和
· 新基因研究顛覆了進步主義的平等
【人在旅途】
· 中歐四國自駕游:信息體會總匯篇
· 尋訪另類布拉格, 解密自由智慧之
· 布拉格,歷史的門檻和英雄之城
· 捷克世遺小城美在金秋
· 德奧匈捷四國五城游之薩爾茨堡
· 魔法森林步道、後湖和高山公路
· 艱難的2023回國之旅
· 奧國的橋,德國的堡,秋色的美
· 在奧地利阿爾卑斯山區徒步
· 在最美風景的阿爾卑斯高山公路自
【神州觀察】
· 用腳投票和用嘴投票
· 撕下中共執政的最後一塊合法性遮
· 習近平的合法性焦慮與中共的第三
· 千年大計碰上了百年不遇
· 紅色江山朽而不倒的秘密
· 鼠頭變鴨脖,壓力下改口有錯嗎?
· 中西間諜的兩種命運,想起金無怠
· 習近平的普氏鐵床治國術
· 端中國碗吃中國糧,先吃上了中國
· 艱難的2023回國之旅
【汗滴家園】
· 屋檐滴水(空調冷凝水)問題的解決
· 退休生活:自己動手修空調
· 梨子的滋味:換微波爐磁控管
· 洗碗機三修記
· 降低噪聲,保溫節能的窗戶DIY
· 房客的水管工修理清單,搞定!
· 55小時大停電的劫後餘生
· 液晶電視開膛手術起死回生記
· DIY:門框的整舊如新
【健康生活】
· 推薦一種新的Medicare保險
· 健康之友-益生菌的種類、作用和
· 長壽及老年痴呆的一些近期研究
· 我的煙酒茶聚散情緣
· 談談老年健保Medicare中的坑
· 自做酸奶的幾個小訣竅
· 告別老乾媽,自製辣椒醬
· 工業N95口罩也可抵禦新冠病毒
· 早飯前鍛煉,減肥效果最好
· 哪種減肥更有效,低碳還是低脂?
【說文論藝】
· 答山貨郎兼議蔣介石與錯殺
· 懇請小編手下留情,不要推薦我的
· 評點中國與美國的奧運獎牌爭霸賽
· 電影《第二十條》,中共為何害怕
· 誰是真正的不完美受害人?
· 評毛澤東詩的文學水平
· 貪也罷,反也罷,都是以人民的名
· 中西文化比較:語言中反映的思維
· 大選感事
· 從《無悔追蹤》到《九三年》革命
【歷史探幽】
· 萊特灣海戰: 英勇小兵拯救四星上
· 中國文化在外來文化侵略下,呈倒
· 評《西方為何領先》, 兼談東方為
· 第二次世界大戰復盤:名將與昏招
· 電影《奧本海默》中的史實謬誤
· 歐洲中世紀和中國元代的初夜權
· 圓明園: 被刻意隱瞞的另一半故事
· 中國和西方文明的交流與撞擊
· 被正史諱莫如深的古巴和越戰秘辛
· 漫話英國的民族和君主,兼談奴化
【往者可追】
· 鼠頭變鴨脖,壓力下改口有錯嗎?
· 紀念父親:中國移動通信的先行者
· 勝利大逃亡-留美歷程紀實
· 記我的英語老師-老美司考特
· 吃的記憶:文革時代下館子
· 禁書、讀書、偷書、竊書和順書
· 回憶78級大學生的畢業分配
【插隊軼事】
【信息技術】
· 讓電腦和萬維網頁提速的小技巧
· 與防火長城鬥智鬥勇:回國安全翻
· 介紹幾個在中國翻牆/科學上網的
· 比爾蓋茨離婚那天, 我的電腦死了
· 推薦幾款手機上的必備應用
· Windows應用的安裝和卸載
· 手機系統升級,暗屏模式省電護眼
· 解決電腦揚聲器音量小的問題
【學海拾貝】
· 對個人尊嚴,國家認同等的隨想
· 偉大復興,強國夢及其他
· 燈下漫筆 (七)
· 活在當下,把握現在
· 我寫故我思,我思故我悅
· 燈下漫筆(六)
· 燈下漫筆 (五)
· 燈下漫筆(四)
· 燈下漫筆(三)
· 燈下漫筆(二)
【財務自由】
· 推薦一種新的Medicare保險
· 通貨膨脹率下降了, 要不要買I-債
· 親歷體驗:人民幣挑戰美元的失敗
· TIPS: 比I-債券更好的抗通脹投資
· 固定利率提高后的I-債券投資
· 美國I-Bond債券的投資策略
· 美國通貨膨脹創新高,工薪族如何
· 夫妻合領社會保險金的最大化策略
· 個人退休賬戶IRA的分配和交稅
· 談談老年健保Medicare中的坑
【吃的藝術】
· 會吃魚的吃魚頭,魚頭要吃鱈魚舌
· 香鮮色味俱全的紅油辣醬
· 製作健康飲料Kefir的簡易方法
· 吃的記憶:文革時代下館子
· 一條改變世界的魚:鱈魚趣事
· 吃的記憶:文革時代下館子
· 咸香酥脆的挪威果仁薄脆餅
· 五味夜話:海鮮吃的就是鮮字
· 吃的藝術和藝術的吃
· 域外美食-挪威燉羊肉和燉菜秘笈
【美國生活】
· 四年前舊作:卷土才俊在江東
· 用腳投票和用嘴投票
· 人生能幾“日全食”?
· 最高法院的裁定不是亞裔的勝利
· 55小時大停電的劫後餘生
【思維火花】
· 從古希臘智慧中汲取的生活藝術
【讀書札記】
· 國家為何失敗,中國制度是優勢還
· 萊特灣海戰: 英勇小兵拯救四星上
· 盎格魯圈代表的是真正的西方文明
· 評《西方為何領先》, 兼談東方為
· 第二次世界大戰復盤:名將與昏招
· 愚蠢的國家戰略是如何出籠的?
· 中俄列名政權殺人最多,對世界和
· 新基因研究顛覆了進步主義的平等
· 基因探密:我們是誰,從哪裡來?
· 中文的突圍,從打字機到人工智能
存檔目錄
11/01/2024 - 11/30/2024
10/01/2024 - 10/31/2024
09/01/2024 - 09/30/2024
08/01/2024 - 08/31/2024
07/01/2024 - 07/31/2024
06/01/2024 - 06/30/2024
05/01/2024 - 05/31/2024
04/01/2024 - 04/30/2024
03/01/2024 - 03/31/2024
02/01/2024 - 02/29/2024
12/01/2023 - 12/31/2023
11/01/2023 - 11/30/2023
09/01/2023 - 09/30/2023
08/01/2023 - 08/31/2023
07/01/2023 - 07/31/2023
06/01/2023 - 06/30/2023
05/01/2023 - 05/31/2023
04/01/2023 - 04/30/2023
03/01/2023 - 03/31/2023
02/01/2023 - 02/28/2023
01/01/2023 - 01/31/2023
12/01/2022 - 12/31/2022
11/01/2022 - 11/30/2022
10/01/2022 - 10/31/2022
09/01/2022 - 09/30/2022
08/01/2022 - 08/31/2022
07/01/2022 - 07/31/2022
06/01/2022 - 06/30/2022
05/01/2022 - 05/31/2022
04/01/2022 - 04/30/2022
03/01/2022 - 03/31/2022
02/01/2022 - 02/28/2022
01/01/2022 - 01/31/2022
12/01/2021 - 12/31/2021
11/01/2021 - 11/30/2021
10/01/2021 - 10/31/2021
09/01/2021 - 09/30/2021
08/01/2021 - 08/31/2021
07/01/2021 - 07/31/2021
06/01/2021 - 06/30/2021
05/01/2021 - 05/31/2021
04/01/2021 - 04/30/2021
03/01/2021 - 03/31/2021
02/01/2021 - 02/28/2021
01/01/2021 - 01/31/2021
12/01/2020 - 12/31/2020
11/01/2020 - 11/30/2020
10/01/2020 - 10/31/2020
09/01/2020 - 09/30/2020
08/01/2020 - 08/31/2020
07/01/2020 - 07/31/2020
06/01/2020 - 06/30/2020
05/01/2020 - 05/31/2020
04/01/2020 - 04/30/2020
03/01/2020 - 03/31/2020
02/01/2020 - 02/29/2020
01/01/2020 - 01/31/2020
12/01/2019 - 12/31/2019
11/01/2019 - 11/30/2019
10/01/2019 - 10/31/2019
09/01/2019 - 09/30/2019
08/01/2019 - 08/31/2019
07/01/2019 - 07/31/2019
06/01/2019 - 06/30/2019
05/01/2019 - 05/31/2019
09/01/2013 - 09/30/2013
發表評論
作者:
用戶名: 密碼: 您還不是博客/論壇用戶?現在就註冊!
     
評論:
中文的突圍,從打字機到人工智能
   

中文的突圍,從打字機到人工智能

讀了被中國媒體大捧的《中文打字機》,比較失望。這本書的作者是斯坦福大學教授Thomas Mullaney(墨磊寧)。全書少學術,多歷史,價值不高。僅僅是中文打字機的敘事史,缺乏深刻的洞察和分析。作者停留在基於政治正確的評價,用社會達爾文主義大帽子抨擊一切對立主張,拒絕對文化優劣和對語言本質的評價。西方的一些學者喜歡站在兩個文化的接縫上,左右逢源,投機取巧。

達爾文進化論的核心觀點是物競天擇,適者生存。這個觀點在社會學上,認為文化有優劣,落後的文化會被淘汰,並沒有錯。我們反對優生學和種族滅絕的同時,也不應該保護被進化淘汰的落後文化。而作者認為:“語言在表達人類思想的能力上是無差別的,至少每種語言都有能力或潛力來表達其使用者想要表達的東西”。不承認文化差別,不承認象形文字和字母文字的差別,會對文化和文明的發展存在影響,表明了作者的多元文化主義立場。

本書反映了一種矛盾心態。中國和世界接軌還是讓世界適應中國。當中國不適應世界體系時,是改造中國,還是改造世界現有的體系。中國和外部世界總是格格不入。中國人永遠處於接軌還是自成體系的矛盾中。如果中國不適應,就認為不是中國有問題,而是現有系統有問題,是偽普世。中國對世界不適應,就說世界對中國有圍剿。我不能融入你,是你的問題。你要對我的不能融入負全責。誰叫你先發,我後發呢?

在計算機發明之前,發明和英文打字機等效的中文打字機是不可能的任務。或者是打字速度,或者是覆蓋內容,或者是成本,或者是複雜性方面,中文打字機不能做到和英文打字機的等效。這是因為中文主要是表意的語素文字,相對於26個英文字母,基本漢字就有三四千。英文打字工作一般是秘書兼職,而中文打字員幾乎都是專業的,因為後者對操作的技能有很高的要求,英文打字機很普及,能夠便攜,而中文打字機笨重,基層單位幾乎沒有。插隊時,北京供電局是我們公社的廠社掛鈎單位,供電局的一個姓呂的中文打字員派駐我們村。當時搞批林批孔運動,我被選到不脫產的公社理論隊伍。縣裡交下任務,讓寫一篇《歷史上勞動人民的反孔鬥爭》。要求兩萬字,一星期交稿。寫完後,要打印上交到縣裡。公社沒有中文打印機,呂師傅把我的文章帶回單位打出來後,需要校對。我專門回到北京,住在前門附近的電力局招待所。那是我第一次看見中文打字機,龐大笨重,可以說是一台活字書寫機器。我改了錯字後,呂師傅在蠟紙打印稿用修改液塗抹掉錯字,並在鉛字盤添加了常用漢字之外的一些鉛字,在打印機上修改。文革時,紅衛兵組織林立,都搞宣傳。主要的方式就是大字報和手工刻印的傳單,很少人用中文打字機。那時寫一手漂亮的毛筆字和鋼筆字是很吃香的。

漢語和漢字不是一回事兒。在通過複合詞造出新詞、詞序自由度高,語法簡單等方面,漢語和英語相似,都發展比較成熟。這裡主要比較書面漢語和字母文字。中國語言學家周有光認為文字有三個階段:原始(形意)時期,古典(意音)時期和字母(表音)時期。漢字處於古典時期。文字的進化進程是:符形從圖符到字符到字母,語段從語詞到音節到音素,表達法從表形到表意到表音。漢字是當今世界上唯一的語素文字,一個活化石。

為什麼中文沒有向拼音文字轉化?主要原因是:第一,漢字的發展歷史短,漢字比楔形文字晚兩千多年。當甲骨文出現時,地中海已經發展出字母文字;第二,秦始皇的大一統,書同文的結果是各種口語的人使用統一的文字,導致文字和口語分離。缺乏不同文字的交流和互相學習的環境,錯失了向字母系統發展的機會;第三,漢字覆蓋的方言太多,發音差別過大,向表音文字發展阻礙大;第四,底層文盲多,文字只是部分有閒階層的需要。沒有動力向簡化發展。而拉丁字母的起源--腓尼基文字是商人們發明的,他們需要一種簡化的符號記賬和貿易,不可能去學習複雜的楔形文字;第五,古代漢語發展出很多優秀的文學作品,而這些文字遺產成為字母化的負擔。因為字母化意味着斷層;第六,漢語普通話410個音節,約1300多個讀音。常用漢字有三四千個。造成同音多字,向表音文字進化比較困難。

中國的口語與書面語處於嚴重分裂狀態;這種分裂影響了中國在邏輯、哲學、法律和科學等領域的發展和進步,僅有文學和書法不受影響,保持了畸形的繁榮。因為書寫成本高,中文力求簡約。與大多數字母文字相比,中文具有更強大的信息容量和壓縮能力。同樣的內容,漢語比英文要減少30%以上的頁面。同時漢字數量龐大、筆畫複雜、意音斷裂、多音多意、語境微妙,使漢語成為世界上幾乎最難以掌握的文字。至今偏遠農村仍有很多人是文盲。大量中國人能識一些基本漢字,但不能閱讀和寫作,處於半文盲狀態。語言是工具,中國人成長過程中,掌握工具的時間遠遠超過使用字母文字的人群,相對減少了學習知識的時間。

非拼音的漢字是至今中國的方言多且差異大的原因。由於字母文字的讀音和口語是一致的,字母文字帶動了統一方言的標準化;因此使用字母文字的民族和國家,口語基本上是統一的。日本和朝鮮使用了字母文字以後,口語基本上統一了。表音文字的蒙古文和滿文促進了中國北方口語向北方官話統一;而用漢字的中國南方,方言多而差異大。

非字母的中文,在中國現代化進程中受到不斷地挑戰。打字機困境只是第一個,漢字由於在輸入輸出,編碼和檢索等方面,效率較字母文字明顯低下,成為了教育及信息化上的瓶頸。幸虧後來有了計算機和漢字輸入方法,解救了中文。雖說還有一些問題,但中文基本度過了第一個挑戰。

人工智能可能是中文要面臨的第二個現代化挑戰。漢語的歧義多和高度依賴語感使計算機的語言識別和理解比字母文字更困難。中文沒有大小寫,單字間沒有空格,不容易像英文一樣區分單詞,專有名詞和縮寫,容易產生歧義。比如“乒乓球拍賣完了”到底是“乒乓球拍”賣完了,還是“乒乓球”“拍賣”完了?下面幾幅圖是百度AI軟件文心一言生成的圖片,就是由於不能正確解析中文單詞產生了歧義。當然這不是很難的問題,應該可以解決。還有許多類似的問題。這個實例是用來說明:許多在英文不是問題的問題,在中文就可能是問題,對人工智能提出了更高更難的要求。




圖片來自網絡


 
關於本站 | 廣告服務 | 聯繫我們 | 招聘信息 | 網站導航 | 隱私保護
Copyright (C) 1998-2024. Creaders.NET. All Rights Reserved.