DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Dylan Mar 04,2025

DeepSeek令人惊讶的负担得起的AI模型挑战了行业巨头。该公司的新聊天机器人具有令人印象深刻的能力,这导致Nvidia的股价大幅下降。它的成功源于创新技术和重要(尽管未公开)投资的独特组合。

DeepSeek测试图片:ensigame.com

DeepSeek V3利用了几种尖端技术:多语预测(MTP),以提高准确性和效率;专家(MOE)的混合物,采用256个神经网络进行加速培训;和多头潜在注意力(MLA),以确保不容忽视关键细节。

DeepSeek V3图片:ensigame.com

尽管DeepSeek最初声称仅支付了600万美元的培训费用,但半分析显示出了更大的基础设施:大约50,000个NVIDIA GPU,总计约16亿美元的服务器投资和9.44亿美元的运营费用。这包括一支实质性的劳动力,一些研究人员每年收入超过130万美元。

DeepSeek图片:ensigame.com

DeepSeek的独立结构,其母公司高级飞行器的大量资金以及其对数据中心的所有权提供了大量资金,因此可以快速创新和有效的资源分配。这与竞争对手的更大,更官僚的结构形成鲜明对比。

DeepSeek图片:ensigame.com

尽管最初的600万美元数字误导了,忽略了大量的研究和基础设施成本,但DeepSeek在AI开发中的总投资仍然代表了一种相对有效的方法。比较培训成本来强调这一点:DeepSeek的R1耗资500万美元,而Chatgpt-4的成本为1亿美元。 DeepSeek的成功强调了资金充足,敏捷的AI公司有效竞争的潜力,即使“预算革命”的叙述有些夸张。