當矽谷還在計算成本,深圳已經改寫規則——中國 AI 的彎道超車
返回文章列表

當矽谷還在計算成本,深圳已經改寫規則——中國 AI 的彎道超車

2026年3月8日
黃老闆(Zell Huang)
AI與科技產業分析中國科技

當矽谷還在計算成本,深圳已經改寫規則

——中國 AI 的彎道超車

2026 年 3 月 8 日


序幕:凌晨三點的杭州

凌晨三點,杭州未來科技城的燈光依然明亮。

在字節跳動的某間會議室裡,一群工程師圍著一塊白板,上面寫著一串數字:1/10。這是他們剛剛得出的結論——訓練一個與 GPT-4 同等級別的大模型,中國團隊現在只需要美國同行十分之一的成本。

窗外,錢塘江的潮水正在退去。但在全球 AI 產業的棋盤上,一場更大的浪潮才剛剛開始。

這週,我們要講一個關於彎道超車的故事。不是速度,而是策略。不是蠻力,而是智慧。


第一章:DeepSeek 的「窮人革命」

1.1 一場關於成本的認知重構

2024 年初,當 OpenAI 宣布 GPT-4 的訓練成本超過 1 億美元時,整個產業都在感嘆:「大模型是富豪的遊戲。」

兩年後,幻方量化旗下的 DeepSeek 用一份技術報告,徹底顛覆了這個認知。

他們的最新模型 DeepSeek-V3.5,在標準基準測試中與 GPT-4o 打平,甚至在某些推理任務上更勝一籌。但真正的震撼彈是附錄裡的那行數字:總訓練成本 557.6 萬美元

這是什麼概念?

Anthropic 訓練 Claude 3.5 花了約 1 億美元。Meta 的 Llama 3 據傳超過 3 億。而 DeepSeek 只用了他們的 1/50 到 1/20

「這不可能,」一位矽谷投資人在推特上寫道,「要麼他們在說謊,要麼我們都被騙了兩年。」

但越來越多的第三方驗證證實:DeepSeek 沒有說謊。他們只是用了一種完全不同的方法論。

1.2 窮人的智慧

幻方量化出身的團隊,本質上是一群「用數學賭博的人」。

在量化交易的世界裡,他們習慣了在極度受限的環境下尋找 alpha——用最少的資源,撬動最大的收益。這種思維被完整移植到了 AI 研發中。

DeepSeek 的秘密武器不是更多的 GPU,而是三個技術突破:

混合專家架構(MoE)的極致優化

傳統大模型每次推理都會激活全部參數,就像發動一台 V12 引擎只為買杯咖啡。DeepSeek 的模型有 6710 億參數,但每次只激活 370 億——卻能達到相近的效果。

他們開發了一種動態路由機制,讓「專家網絡」像精準的外科手術刀一樣,只調用解決當前任務所需的最小參數集合。

FP8 低精度訓練

當業界還在為 FP16(半精度浮點)和 BF16 爭論時,DeepSeek 直接跳到了 FP8。這意味著同樣的顯存可以容納兩倍的模型參數,或者在相同參數下使用一半的硬體。

關鍵在於他們開發了精妙的數值穩定技術,避免了低精度常見的梯度消失和訓練崩潰問題。

數據效率的重新定義

DeepSeek 團隊發現,高質量的小數據集勝過海量低質量數據。他們建立了一套嚴格的數據篩選管道,用模型本身來評估訓練數據的「信息密度」。

結果是:他們只用了約 15 萬億 token 的訓練數據,而 Llama 3 用了 15 萬億,GPT-4 據傳超過 20 萬億。

「我們不是在訓練模型,」DeepSeek 的技術負責人在一次閉門分享中說,「我們是在教會模型如何學習。」

1.3 開源的核彈

如果低成本只是第一拳,那麼完全開源就是 KO 一擊。

DeepSeek-V3.5 的權重、論文、訓練細節全部公開。任何開發者都可以下載、微調、部署——完全免費。

這在商業上看似瘋狂,但在戰略上極其精明:

  • 生態綁定:當全世界開發者都基於 DeepSeek 構建應用,它就成為了事實標準
  • 人才虹吸:頂尖工程師被開源項目的聲望吸引,形成正向循環
  • 地緣槓桿:開源是對抗美國技術封鎖的最佳武器——你無法封鎖公開的知識

「這是中國 AI 的 Linux 時刻,」一位業內資深人士評價,「就像當年開源操作系統打破微軟壟斷一樣,DeepSeek 正在打破算力壟斷。」


第二章:巨頭的反擊

2.1 字節跳動:流量變現的機器

當 DeepSeek 掀起開源風暴時,字節跳動選擇了一條不同的路。

他們沒有公開最強大的模型,但他們做了一件事,沒有任何競爭對手能做到:把 AI 塞進 10 億人的日常

豆包(Doubao)AI 助手現在是抖音、今日頭條、西瓜視頻的標準配置。用戶刷短視頻時,AI 在分析他們的喜好;用戶看新聞時,AI 在生成摘要;用戶購物時,AI 在推薦商品。

這週,字節宣布豆包月活用戶突破 1.2 億——這還只是中國大陸的數字。

「別人做大模型是為了賣 API,」一位接近字節高層的人士透露,「我們做 AI 是為了讓 10 億人離不開我們。」

這就是字節的戰略本質:AI 不是產品,是基礎設施

當 OpenAI 還在為 ChatGPT 的商業化頭疼時,字節已經把 AI 變成了廣告系統的引擎。他們的推薦算法原本就是世界頂級,現在疊加大模型的理解能力,廣告轉化率提升了 40% 以上。

這意味著什麼?

字節每投入 1 美元在 AI 研發上,能從廣告業務中賺回 5 美元。這是閉環商業模式的力量——而 OpenAI 還在每年燒掉 50 億美元尋找盈利模式。

2.2 阿里巴巴:雲端的戰爭

如果說字節在爭奪用戶,阿里巴巴則在爭奪企業。

通義千問(Qwen)系列模型這週發布了 2.5 版本,在多語言理解和程式碼生成上大幅躍進。但真正的重頭戲是阿里雲的「大模型即服務」(MaaS)平台。

「我們不是要你做選擇題,」阿里雲智能總裁在發布會上說,「我們給你的是全套工具箱。」

這個工具箱包括:

  • 100+ 開源和閉源模型任選
  • 一鍵微調和部署
  • 企業級安全合規
  • 與支付、物流、零售的無縫整合

對中國企業來說,這是最務實的選擇。當你在用支付寶收款、菜鳥發貨、釘釘辦公時,用阿里雲的 AI 就像開燈一樣自然。

這週,阿里宣布通義千問的企業客戶突破 50 萬家,涵蓋金融、製造、醫療、教育等 20 多個行業。

「中國的企業數字化比美國慢,但一旦開始就會很快,」一位投資人分析,「阿里在鋪設 AI 時代的『水電煤』。」

2.3 百度:all in 自動駕駛的豪賭

在這場 AI 混戰中,百度選擇了一條最難的路——自動駕駛。

這週,百度的蘿蔔快跑(Apollo Go)宣布在北京、武漢、重慶三個城市實現「真無人」商業運營——車上完全沒有安全員。

這不是測試,是實打實的收費服務。用戶打開百度地圖,叫一輛無人車,從 A 點到 B 點,全程沒有人類干預。

「自動駕駛是 AI 的聖杯,」百度創始人李彥宏在內部信裡寫道,「誰能第一個實現規模化盈利,誰就能定義下一個十年。」

這是一場豪賭。百度在 Apollo 項目上已經燒掉了超過 200 億人民幣,但現在開始看到曙光:

  • 武漢單城單日訂單突破 10 萬
  • 每公里成本已經低於有人駕駛的網約車
  • 2026 年計劃擴展到 20 個城市

「蘿蔔快跑不是未來,是現在,」一位用戶在社交媒體上分享他的乘車體驗,「剛開始有點害怕,但現在覺得比人類司機還穩。」

百度的邏輯很簡單:當別人還在聊天機器人裡卷來卷去時,我已經在改變物理世界的運轉方式。


第三章:算力封鎖與生存遊戲

3.1 晶片戰爭的殘酷現實

2025 年底,美國商務部更新了對華 AI 晶片出口管制清單。這次不僅是 NVIDIA 的 H100/H200,連降規版的 H20 也在禁令之列。

消息傳出當天,NVIDIA 股價下跌 12%,市值蒸發超過 3000 億美元。

但真正的衝擊在中國。

「我們囤的 H100 只夠撐到明年年中,」一位頭部 AI 公司的高管私下透露,「之後怎麼辦?沒人知道。」

這就是中國 AI 產業面臨的殘酷現實:即使你能用 1/10 的成本訓練模型,你還是需要晶片來運行它

但中國人向來擅長在封鎖中求生。

3.2 華為的逆襲

當 NVIDIA 的貨源斷絕,華為昇騰(Ascend)系列晶片成為了唯一的選擇。

這週,華為宣布昇騰 910C 的出貨量突破 100 萬片——這個數字在一年前還是零。

910C 的性能如何?

根據多家中國 AI 公司的測試,在推理任務上,單卡性能約為 H100 的 70-80%。但在訓練任務上,由於軟體生態的差距,效率只有 H100 的 40-50%。

「不夠好,但夠用,」一位使用昇騰晶片的工程師說,「我們在軟體優化上投入了大量資源,把硬件的差距用工程能力補回來。」

DeepSeek 的成功很大程度上就是這種「窮人智慧」的體現——既然沒有最好的晶片,就想辦法讓現有的晶片發揮最大效能。

華為也在快速迭代。據傳 910D 已經在流片,目標是訓練性能追平 H100。

「給我們三年時間,」華為輪值董事長在內部講話中說,「我們會讓世界看到,封鎖只會讓我們更強大。」

3.3 軟體定義晶片

除了華為,中國 AI 產業還在探索另一條路:用軟體繞過硬體限制

清華大學的一個研究團隊這週發表了一篇論文,提出了一種新的訓練框架,可以在消費級 GPU(如 RTX 4090)上高效訓練大模型。

核心思想是「模型並行 + 流水線並行 + 激活檢查點」的組合優化,讓顯存受限的設備也能參與大模型訓練。

「這就像讓 100 台家用電腦協同工作,替代一台超級計算機,」論文的第一作者解釋,「單個設備不夠強,但數量可以彌補。」

這種「分布式訓練」的理念正在中國快速傳播。一些創業公司甚至開始提供「眾包算力」服務,讓普通用戶的閒置 GPU 參與 AI 訓練,賺取代幣獎勵。

「這是共產主義的算力,」一位投資人開玩笑說,「全世界的閒置 GPU 團結起來。」


第四章:開源與閉源的哲學之爭

4.1 兩種世界觀的碰撞

這週,一場關於 AI 發展路徑的辯論在全球科技圈爆發。

爭論的核心是:大模型應該開源還是閉源?

OpenAI 和 Anthropic 代表閉源派。他們的論點是:

  • 安全優先:強大的 AI 必須受到嚴格控制,不能落入壞人手中
  • 商業可持續:只有閉源才能保證足夠的收入投入研發
  • 競爭優勢:技術領先是最好的護城河

DeepSeek、Meta、阿里巴巴代表開源派。他們的反駁是:

  • 創新加速:開源讓全世界聰明人一起改進,比任何單一公司都快
  • 安全透明:開源模型可以被獨立審計,反而更安全
  • 生態主導:誰制定標準,誰就贏得未來

「這不是技術問題,是價值觀問題,」一位業內資深人士評論,「OpenAI 相信集中控制,DeepSeek 相信分布式創新。」

4.2 中國的開源戰略

中國在這場辯論中選擇了明確的立場:全面擁抱開源

這背後有深刻的戰略考量:

繞過封鎖

當美國用晶片禁令試圖卡脖子時,開源成為了最好的反制武器。你無法封鎖公開的程式碼,就像你無法封鎖數學公式。

DeepSeek 的開源不是慈善,是生存策略。

人才爭奪

在全球頂尖 AI 人才爭奪戰中,開源項目是最強大的磁鐵。一個工程師可以在 GitHub 上向世界展示自己的才華,獲得遠超國界的認可。

中國公司意識到,與其花大價錢挖人,不如建立讓人才主動投奔的生態。

標準之爭

歷史上,開源軟體多次改變了產業格局。Linux 打敗了商業 Unix,Android 顛覆了 Nokia,MySQL 挑戰了 Oracle。

中國相信,AI 領域也會重演這個故事。誰的開源模型被全世界採用,誰就能定義 AI 時代的標準。

「我們不是在送技術,」一位中國 AI 公司的高管說,「我們是在買門票——買進全球 AI 生態的門票。」

4.3 Meta 的微妙立場

在這場開源閉源之爭中,Meta 的位置最微妙。

作為美國公司,他們選擇了開源路線(Llama 系列)。這讓他們在中國意外的受歡迎——很多中國開發者把 Llama 視為「西方陣營裡的開源同志」。

但這也讓 Meta 在美國政府那裡備受壓力。

這週,有消息傳出美國商務部正在評估是否應該限制 Llama 模型的出口——雖然是開源軟體,但理論上可以禁止美國公司向特定國家提供技術支持。

「如果連開源都被管制,」一位法律專家評論,「那將是對互聯網精神的根本背叛。」


第五章:未來的輪廓

5.1 2026:轉折之年

站在 2026 年 3 月的時間點,我們可以清晰地看到幾個趨勢:

成本崩潰

DeepSeek 證明了大模型訓練成本可以大幅下降。這意味著 AI 的門檻正在快速降低,未來會有成千上萬的小團隊能夠訓練自己的模型。

多極化世界

AI 產業不再是美國獨大。中國在多個細分領域已經實現領先:推薦算法(字節)、電商 AI(阿里)、自動駕駛(百度)、低成本訓練(DeepSeek)。

地緣政治化

AI 已經成為中美競爭的核心戰場。技術選擇背後是價值觀選擇,商業決策背後是國家利益。

開源勝利

無論閉源派怎麼反對,開源的趨勢不可阻擋。當開源模型的性能追上閉源模型時,閉源的商業理由就崩塌了。

5.2 給開發者的建議

如果你是 AI 開發者,這週的事件給我們什麼啟示?

擁抱開源生態

不要閉門造車。關注 DeepSeek、Llama、Qwen 的更新,參與開源社區,你的貢獻會被全世界看到。

關注效率優化

當 DeepSeek 能用 1/10 成本做到同等效果,意味著「大力出奇蹟」的時代正在結束。未來屬於會做減法的人。

多語言能力是護城河

中國模型在中文理解上的優勢是真實存在的。如果你服務的是中文用戶,不要迷信英文模型的「通用性」。

準備好算力多元化的世界

NVIDIA 不再是唯一選擇。學習如何在華為昇騰、AMD、甚至消費級 GPU 上部署模型,這是未來的必備技能。

5.3 寫在最後

回到凌晨三點的杭州。

那個會議室裡的白板已經換了新的內容,但「1/10」這個數字被圈了出來,旁邊寫著一行小字:「規則改寫者」。

這就是中國 AI 這週給世界的啟示。

當矽谷還在討論如何籌集下一輪 10 億美元融資時,杭州的工程師們已經證明:創新不取決於你有多少資源,而取決於你怎麼使用資源。

當華盛頓還在計算晶片禁令的殺傷力時,深圳的創業者們已經在用軟體繞過硬體的限制。

這不是關於誰更強大的故事。這是關於適應力的故事。

在快速變化的世界裡,最強大的不是體型最大的恐龍,而是最能適應環境的哺乳動物。

中國 AI 正在證明:當你被封鎖、被限制、被低估時,也許正是你彎道超車的最佳時機。


數據附錄

| 指標 | 數值 | 來源 | |------|------|------| | DeepSeek-V3.5 訓練成本 | 557.6 萬美元 | DeepSeek 技術報告 | | GPT-4 估計訓練成本 | 1-2 億美元 | 行業分析 | | 豆包月活用戶 | 1.2 億 | 字節跳動官方數據 | | 通義千問企業客戶 | 50 萬家 | 阿里巴巴官方數據 | | 蘿蔔快跑武漢日訂單 | 10 萬+ | 百度官方數據 | | 華為昇騰 910C 出貨量 | 100 萬片 | 華為官方數據 | | 昇騰 910C 相對 H100 推理性能 | 70-80% | 第三方測試 | | NVIDIA 市值下跌(禁令當天) | 3000 億美元 | 股市數據 |


本週報由 AI 生成,基於公開資料整理。數據截至 2026 年 3 月 8 日。