在美國總統特朗普重返白宮的第一個週末,中國科技界向矽谷及白宮高層投下了震撼消息。中國杭州一家AI初創公司推出的機器人聊天產品「DeepSeek」(深度求索),使得美國在人工智能領域的主導地位受到空前質疑。
這家公司由40歲的青年創業者梁文鋒創辦,產品上架後,其功能和自稱的低開發成本震撼了矽谷以及包括OpenAI在內的競爭對手。美國的AI技術領頭公司如輝達(英偉達)(Nvidia)等在股市上瞬間創紀錄地暴跌。
DeepSeek同時在中國社交媒體上引發沸騰,被視為中國AI能力能匹敵甚至超越美國的證據,之前美國遏制中國AI硬件技術的多年努力似乎付之東流。
DeepSeek的橫空出世,讓各界難以避免地陷入中美之爭的又一輪大討論:美國是否未能阻止中國 AI 產業的進步?DeepSeek是否有效地取代了其主要競爭對手OpenAI的產品ChatGPT?在美中科技戰正酣之際,剛重返執政的特朗普是否會加強對中國AI科技的防堵?
科技分析師、前北京大學光華管理學院教授陶迅(Jeffrey Towson)對BBC中文表示,如果美國的AI公司如同過去的史蒂夫·喬布斯,中國的AI公司則可比擬當時的比爾·蓋茨。雖然它們的運作方式不同,但都將成為終身競爭對手。他說,目前所有的目光都聚焦在DeepSeek上,但當人們意識到中國的Kling AI和 Minimax現已成為全球生成式AI影片生成器的領導者時,可能再次引發衝擊。
https://www.youtube.com/watch?v=vX0SZPAWLR8
AI半導體評論網Tech Tech China總監卓薇安(Vivian Toh)向BBC分析,DeepSeek的成功證明中國的AI技術具備自身的創新能力,而非僅僅基於OpenAI或使用其開源模型。「AI大模型的發展路徑,未必是OpenAI的路。」
然而,新加坡國立大學李光耀管理學院的資深研究員艾力克斯·卡普里(Alex Capri)則指出,DeepSeek的成就顯示中國公司在創新和尋找方法方面,巧妙地規避了華盛頓施加的出口管制及技術轉移的層層限制。「這是一種不對稱的權力結果。自由可得的傳統技術被巧妙改裝,轉變為一種增效器。但外界仍需觀察DeepSeek最初囤積的輝達高端 AI 晶片是否在這一過程中扮演了更重要的角色,或是否還有其他外國技術元素對 DeepSeek的發展提供了關鍵協助。」
上週一(20日),中國總理李強主持召開了一場專家和企業家代表的座談會,聽取他們對《政府工作報告(徵求意見稿)》的意見與建議。40歲的梁文鋒受邀在會上發言。
有分析指出,考慮到中國政府近年來在整肅阿里巴巴等科技巨頭後,對私營科技公司的管控與提防相當嚴厲,北京此刻讓梁文鋒高調出席並發表報告,意義深遠。有觀點認為,北京此舉與DeepSeek本週在矽谷科技界及華爾街股市引發的震撼效應相呼應,似乎是在向新上任的特朗普政府挑戰,意圖「秀肌肉」。
DeepSeek震撼美國股市後,美國總統特朗普在談話中特別提到DeepSeek的成功,並表示這對美國的AI產業來說是個警鐘,「我們美國必須全神貫注於競爭才能致勝」。他還稱中國衝擊對矽谷或許是「正面」的影響,迫使矽谷以更低成本的方式進行創新。
分析美中AI科技戰的發展,位於華府的智庫保衛民主基金會(FDD)中國資深研究員辛格頓(Craig Singleton)向BBC分析,DeepSeek熱潮背後,北京將人工智慧視為其在當今創新軍備競賽中爭取主導地位的基石,目的不僅是為了在人工智慧領域取得優勢,更希望利用這一優勢,在高超音速、量子計算和自主系統等領域領先一步,重塑全球的權力版圖。
辛格頓認為在DeepSeek震驚金融市場後,特朗普政府對中國的AI挑戰及管制不會鬆手,且會越來越積極。
新加坡國立大學的卡普里(Alex Capri)也告訴記者,美國政府顯然會尋找方法來阻止如今可能已經進入開源平台的戰略技術。
他表示,如果中國及其他公司能夠開發出領先的認知AI,並利用這一技術在其他戰略領域(包括軍事用途)中提升競爭優勢,而不需要使用輝達的先進AI晶片,華盛頓將失去重要的地緣政治槓桿。隨著特朗普政府向「中等收入國家」施壓,要求它們在建立數據中心或雲基礎設施時選擇美國而非中國技術,這一問題在未來可能會變得更加重要。
分析師陶迅則批評美國政府,指出對中國公司的施壓往往是不穩定且不合邏輯。他認為,華府對北京的防堵行動通常來自美國科技公司的遊說,以國家安全的名義掩蓋其真正的意圖。
2024年聖誕節後,DeepSeek率先發佈最新的AI系統DeepSeek-V3,相關市場及政治效應逐漸在矽谷擴散。昨日,DeepSeek衝上美國Apple App Store免費應用程式下載榜首,成為引發這輪股市震蕩的標誌性事件。
矽谷創投家兼特朗普顧問馬克·安德森(Marc Andreessen)將 DeepSeek-R1 描述為「人工智慧的斯普特尼克(Sputnik)時刻,這是指蘇聯於1957年首度發射的人造衛星。更有許多媒體將此事件比喻為美國AI界的「珍珠港事件」。
這款AI模型搭載了DeepSeek-V3,創辦人梁文鋒將DeepSeek形容為開放源代碼模型中排名第一,且能媲美全球最先進的封閉模型。
在梁文鋒旗下的幻化魔方公司發佈自稱的低成本AI模型後,美國AI概念股應聲大跌。其中AI 晶片設計龍頭輝達股價週一暴跌了16.97%,市值蒸發達5926.58億美元。許多分析指出,DeepSeek震撼美國科技界的原因不僅在於其性能足以與全球首要競爭對手ChatGPT一較高下,更重要的是成本僅為其對手的一小部分,這立即引發市場及輿論對美國在AI領域競爭力的擔憂。
根據台媒《天下雜誌》報導,從美國許多第三方的基準測試結果來看,DeepSeek系統超越了許多大批美國同行,例如Meta的Llama 3.1、OpenAI 的GPT-4o,以及Anthropic的Claude Sonnet 3.5等等,而這些矽谷引以為傲的模型動輒需要上億美元的投入才能推出。相較之下,DeepSeek僅需約600萬美元的開發成本。
Bernstein科技分析師的研究進一步指出,DeepSeek的AI模型價格比起美國OpenAI的產品便宜20至40倍。根據公開資料,DeepSeek Reasoner R1模型處理每百萬個輸入字元的成本僅為0.55美元,而OpenAI的同類型模型則需15美元。
半導體分析師卓薇安向BBC解釋,在DeepSeek出現之前,業界共識認為AI大模型的開發需要投入百億美元級別的資金以獲得算力,因此多數大公司都必須掌握上億美元的資金才能維持競爭資格。但DeepSeek的出現打破了這一共識:「大家發現只需幾百萬美元便能達到相同效果,這震驚了所有人,甚至讓輝達等晶片廠商的價值不再如大家想像中那麼珍貴。」
不過,AI研究學者、台灣政治大學學務長蔡炎龍在臉書專號分析指出,如果沒有基礎的開源模型,如Llama等,就無法開發出DeepSeek R1,而這些基礎開源模型的開發也需要花費相當的資金。蔡教授表示:「DeepSeek更像是在進行聰明的微調。」
台灣財經評論員胡采蘋則質疑,DeepSeek的母公司幻化魔方是最重視晶片裝備的一家公司,過去中國媒體曾報導他們大量添購GPU及輝達晶片,為自身發展增添動力。因此,DeepSeek的開發背後不可能僅僅花費600萬美元(約新台幣一億)的成本。
此外,路透社今日發表的分析報導稱,有研究報告中強調,DeepSeek V3模型的總訓練成本尚不清楚,但遠高於該新創公司所說的用於運算能力的558萬美元。美國 Scale AI 執行長汪滔(Alexandr Wang )上週在接受CNBC採訪時也指稱 DeepSeek 應該擁50,000顆輝達H100晶片用來開發模型,而購買這些晶片需要的資金遠遠高於558萬美元。
至今,DeepSeek沒有公開回應對於其成本的質疑。
據此,卓薇安向BBC強調稱如果不是來自內部團隊,很難給出負責任的產品投資金額數據,她認為目前外界可以證實的是DeepSeek這套產品在算法上實現了絕對領先,但尚未有證據顯示其有全方位的領先。
DeepSeek的橫空出世,可以管窺中國公司以低價創新模式試圖在全球市場突圍的邏輯。
台北AI諮詢公司Ikala執行長程世嘉在個人專頁評論稱說,完全開源的DeepSeek象徵著AI普及化便宜化的時代即將到來。他分析,當DeepSeek等AI產品能夠如此普及通用且成本低廉之際,只會更增加全世界的需求,主因是AI是所謂的通用型技術,包含「又快、又好、又便宜」且人人都會使用的通性。程先生舉例,過去只有水力和電力能稱得上是最基本的通用型技術,而現在AI就是下一個水電,正在變成人類的基礎設施。
陶迅也向BBC說,中國公司在成本創新方面擁有超過30年的歷史,擅長以可接受的品質將產品價格壓低。比如在電動車領域的比亞迪、電信設備領域的華為以及電子商務領域的拼多多等。現在,DeepSeek在人工智慧領域也展現了這一優勢。
陶迅說,「低價是贏得中國中產階級及全球南方市場,特別是東南亞和拉丁美洲的關鍵。」
但台北的半導體評論家許美華在臉書稱,說到底,晶片才是關鍵,因為複雜算力要靠高階晶片。「晶片規格是先天優勢,其他都是後天努力。再好的演算法、工程優化,即使在效能上取得一時的領先,比到最後,都抵不過晶片先天算力的限制。」她說,若美國未來真的全面執行拜登下台前頒布的AI晶片三級禁令,全方位的封鎖中國取得晶片的管道,未來中國公司在AI技術上突破是很困難的事情。
本網頁內容為BBC所提供, 內容只供參考, 用戶不得複製或轉發本網頁之內容或商標或作其它用途,並且不會獲得本網頁內容或商標的知識產權。
30/01/2025 11:00AM
29/01/2025 05:00PM
29/01/2025 05:00PM