本人的股票這幾日跌了不少,納斯達克大盤退卻,科技股,主要是半導體科技股受到中國打壓,全面退卻。台積電五日跌幅 3.83%,英偉達五日跌幅3.97%, AI巨頭谷歌五日跌幅3.09%, 臉書五日跌幅 2.93%。 不過大家不要誤解,來自中國的打壓和中國政府無關,而是和中國一家不見經傳的AI公司推出的一款人工智能模型有關,杭州深度求索人工智能基礎技術研究有限公司最新研發推出一款語言大模型,叫做Deepseek V3. 這款模型是開源模型,採用的計算芯片是英偉達專門為中國製造的降級H800,V3模型建立後只用了兩個月的”訓練“, 就已經達到frontier level,在計算能力上,達到甚至超過美國的AI巨頭臉書的Llama, GPT, Cloude, 比如在MMLU, Deepseek能力僅次於Cloude, 勝過GPT, Qwen, Llama, 在Math, AIME和Codeforces三個關鍵領域,橫掃所有美國AI公司,獨占鰲頭。這還不是最亮眼的,神奇的是Deepseek運算時間僅僅為2048隻二流芯片的計算小時,運算費用只有600百萬美元,不到臉書Llama語言模型費用的10%, 不到谷歌AI大模型的5%,因此被戲稱為AI界的”拼多多“。 這個模型推出後立刻被西方AI專業評估機構,比如Techcrunch作了全面的檢驗,結果顯示該模型運行穩定,速度驚人。唯一的錯誤是被問及”你是誰?”時,該模型回答:“我是Chatgpt,” 這是因為該模型把Chatgpt運算數據納入了自己的大數據平台。
中國人喜歡用”震撼“二字來自我牛逼,這次是美國人用這兩個字來形容Deepseek, CNBC的金融記者Deirdre Bosa形容中國這模型全面挑戰了美國AI行業,既然中國可以用二流的芯片,微不足道的預算做出了可以和美國AI巨頭化費了幾十倍以上的芯片計算小時做出的語言大模型,那投資這就會質疑美國AI公司的發展前景,同時,中國也給世界AI弱國做出了榜樣,AI的入行門檻並不高,也不需要龐大資金。 所以,這幾天美國AI有關的股票萎靡不振,投資者需要時間消化來着中國的“震撼”。 住Deepseek取勝的技術秘訣是什麼,看到的披露不多,只看到報道該模型的開發技術人員說他們採用的是“分類專家”框架搜索數據,這使得該模型的搜索效率要遠遠好於美國模型。 我不是AI專家,無從深入評論,只知道Deepseek讓我的股票受損了。下面是美國AI人士對於Deepseek做的技術分析和比較: 中國剛剛推出六代機,碾壓美國的預警機還有美國沒有的電磁彈射兩棲攻擊艦,現在又在AI領域對美形成威脅,這次新年對於美國AI行業來說,是“楊白勞的新年”,難怪美國打壓中國第一打手,美國商務部長雷蒙多在離任前終於感嘆:美國對於中國的芯片打壓是”a fool's errand." 人將離任,其言也善。 |