Lar > Notícias > A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

Feb 19,25(1 anos atrás)
A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

O modelo inovador de IA de Deepseek desafia os gigantes da indústria, apesar das reivindicações de custos mínimos de treinamento. Este artigo examina as tecnologias inovadoras e investimentos substanciais da Deepseek, revelando uma imagem mais complexa do que a apresentada inicialmente.

A IA da Deepseek, com recursos que se destacaram que até surpreendeu seus criadores, emergiu como um concorrente formidável, impactando principalmente o preço das ações da NVIDIA. Seu sucesso decorre de uma combinação única de inovações arquitetônicas e métodos de treinamento.

DeepSeek Testimagem: ensigame.com

Os principais avanços tecnológicos incluem:

  • Previsão de vários toques (MTP): Prevendo simultaneamente várias palavras, aumentando a precisão e a eficiência.
  • Mistura de especialistas (MOE): Utilizando 256 redes neurais, ativando oito para cada token, acelerando o treinamento e melhorando o desempenho.
  • Atenção latente de várias cabeças (MLA): Extraindo repetidamente os detalhes-chave, minimizando a perda de informações e aprimorando o entendimento diferenciado.

A Deepseek reivindicou inicialmente um custo de treinamento notavelmente baixo de US $ 6 milhões para o Deepseek V3, usando apenas 2048 GPUs. No entanto, uma investigação mais aprofundada por semiânica revelou uma infraestrutura significativamente maior, abrangendo aproximadamente 50.000 GPUs NVIDIA Hopper (incluindo unidades H800, H100 e H20) distribuídas em vários data centers. Isso se traduz em um investimento total do servidor de aproximadamente US $ 1,6 bilhão e despesas operacionais estimadas em US $ 944 milhões.

DeepSeek V3imagem: ensigame.com

A Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, se beneficia de possuir seus data centers, promover o controle e a rápida inovação. Sua natureza autofinanciada contribui para a agilidade e a rápida tomada de decisão. A empresa atrai os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, principalmente das universidades chinesas.

DeepSeekimagem: ensigame.com

O valor de US $ 6 milhões, portanto, representa apenas os custos de GPU pré-treinamento, excluindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento total da Deepseek no desenvolvimento da IA ​​excede US $ 500 milhões. Sua estrutura enxuta permite inovação eficiente, contrastando com empresas maiores e mais burocráticas.

DeepSeekimagem: ensigame.com

Embora o sucesso da Deepseek destaque o potencial de empresas independentes de IA bem financiadas, a narrativa inicial "favorável ao orçamento" é enganosa. Sua vantagem competitiva está enraizada em investimentos substanciais, avanços tecnológicos e uma equipe altamente qualificada. No entanto, mesmo com essas despesas significativas, os custos da Deepseek ainda prejudicam significativamente os concorrentes; Por exemplo, seu modelo R1 custou US $ 5 milhões, em comparação com os US $ 100 milhões do ChatGPT4.

Descobrir
  • Fishing For Friends
    Fishing For Friends
    Mergulhe no Fishing for Friends – a sua aventura de simulação de pesca para dispositivos móveis!O Fishing for Friends traz a emoção da pesca directamente para o seu dispositivo móvel!Descubra 15 corpos de água únicos, escolha entre mais de 30 iscas e
  • Smart Baby Shapes
    Smart Baby Shapes
    Smart Baby Shapes é uma aplicação cativante e interativa que ajuda as crianças a aprenderem sobre cores, formas, tamanhos e objetos através do brincar. Utilizando uma mistura de formas coloridas em diferentes tamanhos e objetos estáticos ou em movime
  • Zarta Trivia Party Game
    Zarta Trivia Party Game
    O jogo de festa definitivo para desafiar seus amigos! Divirta-se com quizzes complicados e respostas enganosas!Na Zarta, seu objetivo é responder perguntas reais e difíceis com respostas enganosas para enganar seus amigos. É uma ótima maneira de apro
  • Skip 10 - Card Game
    Skip 10 - Card Game
    Skip 10 - Jogo de Cartas é um jogo de cartas eletrizante criado para amigos e família, combinando estratégia e habilidade. Para vencer, seja o primeiro a descartar todas as suas cartas formando uma sequência numérica de 1 a 10, enquanto as cartas Ski
  • Партии Вильгельма Стейница
    Партии Вильгельма Стейница
    Explore a inteligência estratégica do primeiro campeão mundial oficial de xadrez, Wilhelm Steinitz, com o aplicativo Партии Вильгельма Стейница. Esta coleção abrangente apresenta 700 partidas de seu repertório, mostrando sua doutrina revolucionária d
  • Leather Heels
    Leather Heels
    Descubra ideias incríveis de design de salto em couro gratuitamente com este aplicativo. Perfeito para amantes de sapatos que valorizam qualidade e estilo sem gastar muito. Ao comprar sapatos, a qualidade é o mais importante. Saltos plásticos baratos