arzh-CNenfrdejakoplptesuk
Pesquisa encontrar 4120  disqus social  tg2 f2 lin2 in2 Ícone X 3 y2  p2 tik steam2

Nvidia GB300 NVL72 apresenta ganho recorde de desempenho - +45% para DeepSeek R1 vs GB200

Nvidia divulga oficialmente os resultados do benchmark MLPerf para seu novo sistema em escala de rack Blackwell Ultra GB300 NVL72, afirmando Aumento de 45% na produtividade na inferência DeepSeek R1 comparado à geração anterior GB200. O sistema combina uma arquitetura atualizada, unidades tensoras aceleradas e uma série de otimizações em nível de software, o que permitiu à Nvidia assumir primeiro lugar em todos os testes principais, incluindo Llama 3.1 405B, Llama 3.1 8B e Whisper.

Blackwell Ultra GB300

Contra o pano de fundo Implantações de GB200 em data centers globais, nova versão GB300 com arquitetura Blackwell Ultra vai mais longe ao oferecer uma largura de banda significativamente maior entre GPU - 130 TB/s através NVLink de 1,8 TB/s entre cada um dos 72 sistemas gráficos no rack. Isso permitiu que até mesmo os maiores modelos de linguagem fossem dimensionados com eficiência, mantendo a latência estável em altos volumes de processamento.

Os principais componentes do crescimento foram núcleos tensores atualizadosfornecendo Operações de atenção 2x mais rápidas e 50% mais FLOPS para tarefas de IA, bem como o uso ativo do formato NVFP4 para quantização de pesos. Isso tornou possível reduzir o volume do modelo sem perda de precisão e aceleração de cálculos, especialmente em tarefas de inferência no DeepSeek R1.

De acordo com a Nvidia, essas melhorias podem tornar Blackwell Ultra a principal ferramenta na construção do chamado "Fábricas de IA", onde a otimização de energia impacta diretamente a lucratividade do processamento. De acordo com suas declarações, O GB300 é capaz de rodar 5 vezes mais rápido que os aceleradores Hopper, o que é especialmente relevante no contexto de soluções competitivas da AMD e da Huawei, que também estão demonstrando crescimento no segmento de aceleradores de IA.

Considerando que Entregas de GB300 começarão este mês, a divulgação dos resultados recordes do MLPerf parece ser parte da campanha estratégica da Nvidia para fortalecer sua liderança em soluções de IA empresarial.