Deepseekの手頃な価格は神話です。革新的なAIは実際には16億ドルの費用がかかります。
Deepseekの驚くほど手頃な価格のAIモデルは、業界の巨人に挑戦しています。同社の新しいチャットボットは印象的な機能を誇っており、Nvidiaの株価の大幅な低下に貢献しています。その成功は、革新的なテクノロジーと重要な、非公開の投資のユニークな組み合わせに由来しています。
画像:Ensigame.com
DeepSeek V3は、いくつかの最先端の技術を活用しています。精度と効率を向上させるためのマルチトークン予測(MTP) 。加速トレーニングに256のニューラルネットワークを採用している専門家(MOE)の混合。そして、重要な詳細が見落とされないようにするためのマルチヘッドの潜在的な注意(MLA) 。
画像:Ensigame.com
Deepseekは当初、わずか600万ドルのトレーニングコストを主張していましたが、Semianalysisははるかに大きなインフラストラクチャを明らかにしました。約50,000のNVIDIA GPUで、合計約16億ドルのサーバー投資と9億4,400万ドルの運用費用です。これにはかなりの労働力が含まれ、一部の研究者は年間130万ドル以上を稼ぎます。
画像:Ensigame.com
Deepseekの独立した構造は、親会社であるHigh-Flyerとそのデータセンターの所有権からの多額の資金によって支えられており、迅速なイノベーションと効率的なリソース割り当てを可能にします。これは、競合他社のより大きく、より官僚的な構造とは対照的です。
画像:Ensigame.com
最初の600万ドルの数値は誤解を招き、重要な研究とインフラストラクチャコストを省略していますが、AI開発に5億ドル以上のDeepSeekの全体的な投資は、比較的効率的なアプローチを表しています。これは、トレーニングコストを比較することで強調されています:DeepseekのR1の費用は500万ドル、ChatGpt-4は報告された1億ドルの費用がかかります。 Deepseekの成功は、たとえ「予算革命」の物語がいくらか膨らんでいても、資金提供された機敏なAI企業が効果的に競争する可能性を強調しています。