舊金山人工智能初創企業Anthropic指控三家中國公司通過不當手段大量抓取其人工智能技術數據,以加速自研系統開發。
Anthropic周一在一篇博客文章中表示,中國三家知名初創企業深度求索、月之暗面和稀宇科技利用約2.4萬個虛假賬號,與Anthropic的Claude聊天機器人產生了超過1600萬次對話,這些數據可用於訓練三家公司自己的聊天機器人。
利用一個人工智能系統的數據訓練另一個系統的過程被稱為知識蒸餾,在人工智能領域較為常見。但Anthropic的服務條款禁止任何人以秘密方式抓取數據用於蒸餾,同時不允許其技術在中國境內使用。
Anthropic的主要競爭對手OpenAI也指控中國公司從其聊天機器人ChatGPT中大量提取數據用於類似目的。
在上周致美國國會眾議院中國問題特設委員會的一份備忘錄中,OpenAI稱,深度求索等中國初創企業正採用新型的“混淆式”蒸餾手段,“持續搭便車”使用OpenAI及其他美國公司開發的技術。
與OpenAI一樣,Anthropic稱此類行為構成國家安全風險,並表示這可能讓中國得以開發用於製造生物武器或大規模監控工具的人工智能技術。Anthropic已為其技術設置安全防護機制,防止被用於此類用途,但這些防護措施在蒸餾過程中可能被剝離。
Anthropic呼籲政府官員及其他人工智能企業共同阻止中國公司對美國模型進行蒸餾。
“此類行動正變得愈發激烈且手段更趨複雜,”Anthropic在文章中表示,“可供採取行動的時間窗口正迅速縮小,且威脅已超出單一企業或地區範圍。應對這一問題,需要行業參與者、政策制定者及全球人工智能界迅速採取協同行動。”
深度求索、月之暗面、稀宇科技三家公司暫未回應置評請求。
此文發布之際,Anthropic正與美國國防部就五角大樓對其技術的使用陷入爭執。五角大樓已批准將Anthropic的技術用於涉密任務,但因該初創公司不希望其技術被應用於自主武器或國內監控領域,五角大樓威脅要終止雙方的合作關係。
去年,深度求索推出了性能與全球市場同類產品相當的人工智能技術,令硅谷科技企業震驚,並引發美國金融市場劇烈震盪。
在此之前,硅谷的普遍觀點是:沒有數十億美元的專用計算機芯片,就無法打造出最強大的人工智能系統。但深度求索表示,打造其技術所耗費的資源遠少於此。
與美國企業一樣,深度求索、月之暗面、稀宇科技均通過從互聯網搜集的計算機代碼和數據構建人工智能技術。全球人工智能企業都高度依賴開源模式——即免費共享支撐其技術的代碼,並復用他人分享的代碼。它們認為這是加速技術發展的一種途徑。
人工智能企業還需要海量網絡數據來訓練系統。頂尖人工智能系統通過分析互聯網上幾乎所有文本習得相關能力。
知識蒸餾常被用於訓練新系統,開源技術通常允許這一做法。但如果一家公司從專有技術中提取數據,則可能存在法律問題。
目前估值達3800億美元的Anthropic正面臨多起訴訟,它被控非法使用受版權保護的網絡數據訓練系統。去年9月,在一樁具有里程碑意義的法律和解中,法官裁定Anthropic非法下載並存儲數以百萬計受版權保護的書籍,該公司同意向一批作者和出版商支付15億美元賠償金。這是美國版權案史上金額最高的賠償。
OpenAI及其他人工智能企業也面臨類似訴訟,其中包括《紐約時報》對OpenAI及其合作夥伴微軟提起的訴訟。該訴訟稱,《紐約時報》數以百萬計的文章被用於訓練自動聊天機器人,而這些機器人如今已成為一個與時報構成競爭關係的可靠信息來源。OpenAI和微軟均否認相關指控。