DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

作者 : Dylan Mar 04,2025

DeepSeek令人驚訝的負擔得起的AI模型挑戰了行業巨頭。該公司的新聊天機器人具有令人印象深刻的能力,這導致Nvidia的股價大幅下降。它的成功源於創新技術和重要(儘管未公開)投資的獨特組合。

DeepSeek測試圖片:ensigame.com

DeepSeek V3利用了幾種尖端技術:多語預測(MTP),以提高準確性和效率;專家(MOE)的混合物,採用256個神經網絡進行加速培訓;和多頭潛在註意力(MLA),以確保不容忽視關鍵細節。

DeepSeek V3圖片:ensigame.com

儘管DeepSeek最初聲稱僅支付了600萬美元的培訓費用,但半分析顯示出了更大的基礎設施:大約50,000個NVIDIA GPU,總計約16億美元的服務器投資和9.44億美元的運營費用。這包括一支實質性的勞動力,一些研究人員每年收入超過130萬美元。

DeepSeek圖片:ensigame.com

DeepSeek的獨立結構,其母公司高級飛行器的大量資金以及其對數據中心的所有權提供了大量資金,因此可以快速創新和有效的資源分配。這與競爭對手的更大,更官僚的結構形成鮮明對比。

DeepSeek圖片:ensigame.com

儘管最初的600萬美元數字誤導了,忽略了大量的研究和基礎設施成本,但DeepSeek在AI開發中的總投資仍然代表了一種相對有效的方法。比較培訓成本來強調這一點:DeepSeek的R1耗資500萬美元,而Chatgpt-4的成本為1億美元。 DeepSeek的成功強調了資金充足,敏捷的AI公司有效競爭的潛力,即使“預算革命”的敘述有些誇張。