Lar > Notícias > A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

Feb 19,25(2 meses atrás)
A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

O modelo inovador de IA de Deepseek desafia os gigantes da indústria, apesar das reivindicações de custos mínimos de treinamento. Este artigo examina as tecnologias inovadoras e investimentos substanciais da Deepseek, revelando uma imagem mais complexa do que a apresentada inicialmente.

A IA da Deepseek, com recursos que se destacaram que até surpreendeu seus criadores, emergiu como um concorrente formidável, impactando principalmente o preço das ações da NVIDIA. Seu sucesso decorre de uma combinação única de inovações arquitetônicas e métodos de treinamento.

DeepSeek Testimagem: ensigame.com

Os principais avanços tecnológicos incluem:

  • Previsão de vários toques (MTP): Prevendo simultaneamente várias palavras, aumentando a precisão e a eficiência.
  • Mistura de especialistas (MOE): Utilizando 256 redes neurais, ativando oito para cada token, acelerando o treinamento e melhorando o desempenho.
  • Atenção latente de várias cabeças (MLA): Extraindo repetidamente os detalhes-chave, minimizando a perda de informações e aprimorando o entendimento diferenciado.

A Deepseek reivindicou inicialmente um custo de treinamento notavelmente baixo de US $ 6 milhões para o Deepseek V3, usando apenas 2048 GPUs. No entanto, uma investigação mais aprofundada por semiânica revelou uma infraestrutura significativamente maior, abrangendo aproximadamente 50.000 GPUs NVIDIA Hopper (incluindo unidades H800, H100 e H20) distribuídas em vários data centers. Isso se traduz em um investimento total do servidor de aproximadamente US $ 1,6 bilhão e despesas operacionais estimadas em US $ 944 milhões.

DeepSeek V3imagem: ensigame.com

A Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, se beneficia de possuir seus data centers, promover o controle e a rápida inovação. Sua natureza autofinanciada contribui para a agilidade e a rápida tomada de decisão. A empresa atrai os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, principalmente das universidades chinesas.

DeepSeekimagem: ensigame.com

O valor de US $ 6 milhões, portanto, representa apenas os custos de GPU pré-treinamento, excluindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento total da Deepseek no desenvolvimento da IA ​​excede US $ 500 milhões. Sua estrutura enxuta permite inovação eficiente, contrastando com empresas maiores e mais burocráticas.

DeepSeekimagem: ensigame.com

Embora o sucesso da Deepseek destaque o potencial de empresas independentes de IA bem financiadas, a narrativa inicial "favorável ao orçamento" é enganosa. Sua vantagem competitiva está enraizada em investimentos substanciais, avanços tecnológicos e uma equipe altamente qualificada. No entanto, mesmo com essas despesas significativas, os custos da Deepseek ainda prejudicam significativamente os concorrentes; Por exemplo, seu modelo R1 custou US $ 5 milhões, em comparação com os US $ 100 milhões do ChatGPT4.

Descobrir
  • Simulado Concurso INSS
    Simulado Concurso INSS
    O Simulado Concurso INSS foi projetado para otimizar sua preparação para os exames do Instituto Nacional de Seguridade Social (INSS), oferecendo uma solução de estudo eficiente e prática. Este aplicativo fornece uma vasta coleção de perguntas de múltipla escolha provenientes diretamente dos exames do INSS anteriores, permitindo que você
  • Dusklight Manor
    Dusklight Manor
    Bem -vindo ao Dusklight Manor, um jogo interativo fascinante, onde você embarca em uma jornada emocionante cheia de segredos misteriosos, romance e escondidos. Quando jovem, em busca de um novo emprego, você se encontrará irresistivelmente atraído por esta mansão misteriosa, cativada pelas oportunidades.
  • Hitozuma Elf no Orusuban
    Hitozuma Elf no Orusuban
    Mergulhe no mundo encantador de hitozuma elf no orusuban, onde aventura floresce nos cantos mais inesperados. Esqueça as batalhas convencionais e o nível sem fim; Este aplicativo apresenta uma reviravolta deliciosa. Entre em um RPG simples e cativante em busca de eventos em uma cidade movimentada. Como Lili EMB
  • Indian Train Racing Games
    Indian Train Racing Games
    Mergulhe no emocionante mundo dos jogos de corrida de trens indianos, onde você pode embarcar em uma jornada de tirar o fôlego como motorista de trem como nenhum outro. Este jogo redefine as simulações de direção de trem, oferecendo uma experiência emocionante e autêntica. Como mecânico de trem local, você navegará até
  • DubokuTV
    DubokuTV
    O Dubokutv é o seu principal destino para transmitir uma ampla variedade de dramas de TV asiáticos, programas de variedades e anime, todos disponíveis gratuitamente. Com sua interface amigável, você pode mergulhar em conteúdo de alta qualidade sem a necessidade de registro. Esteja você está usando um telefone celular, tablet, TV ou qualquer OT
  • Thailand Stock Market, Stocks
    Thailand Stock Market, Stocks
    Apresentando o mercado de ações da Tailândia, o aplicativo de ações, uma ferramenta poderosa criada para capacitar sua jornada de negociação na Bolsa de Valores da Tailândia. Seja você um investidor experiente ou um novato, este aplicativo o recebe com tudo o que você precisa para tomar decisões de investimento inteligentes e informadas. Acesse ações em tempo real