Mundo

Chips da Nvidia avançam em treinamento de sistemas de IA, mostram dados novos

Embora grande parte da atenção do mercado acionário tenha se voltado para um mercado mais amplo de inferência de IA, no qual os sistemas de IA lidam com perguntas de usuários, o número de chips necessários para treinar esses sistemas ainda é uma questão competitiva importante. A chinesa DeepSeek afirma ter criado um chatbot competitivo usando muito menos chips do que os rivais norte-americanos.

Os resultados foram os primeiros divulgados pela MLCommons sobre o desempenho dos chips no treinamento de sistemas de IA como o Llama 3.1 405B, modelo de IA de código aberto lançado pela Meta.

A Nvidia e seus parceiros foram os únicos participantes que enviaram dados sobre o treinamento desse grande modelo, e os dados mostraram que os novos chips Blackwell da Nvidia são, em uma base por chip, mais de duas vezes mais velozes que a geração anterior de chips Hopper.

Nos resultados mais rápidos dos novos chips da Nvidia, 2.496 chips Blackwell concluíram o teste de treinamento em 27 minutos. Foram necessários cerca de três vezes mais chips da geração anterior da Nvidia para conseguir um tempo mais rápido, segundo os dados.

Em coletiva de imprensa, Chetan Kapoor, diretor de produtos da CoreWeave, que colaborou com a Nvidia na produção de alguns dos resultados, disse que tem observado uma tendência no setor de IA de reunir grupos menores de chips em subsistemas para tarefas separadas de treinamento de IA, em vez de criar grupos homogêneos de 100 mil chips ou mais.

“Usando uma metodologia como essa, eles podem continuar a acelerar ou reduzir o tempo de treinamento de alguns desses modelos malucos de vários trilhões de parâmetros”, disse Kapoor.



Fonte

Deixe um comentário

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Artigos relacionados

Mundo

Neurônios artificiais replicam funções biológicas trocando elétrons por íons

É um verdadeiro salto na tecnologia da computação neuromórfica, diminuindo tamanho e...

Mundo

Astrônomos raqueiam telescópio para enxergar mais longe

Em astronomia, a regra geral é: Quer uma imagem melhor, construa um...

Mundo

Massacre em prisão do Equador deixa 31 mortos durante rebelião violenta

Trinta e uma pessoas morreram neste domingo /9) durante um dia de...

Mundo

Aquecimento e resfriamento sem energia usa um único material

Energia Redação do Site Inovação Tecnológica – 10/11/2025 Diagrama conceitual da tecnologia de processamento...