Recursos da arquitetura GeForce GTX 280

Além disso, cada módulo TPC consiste em uma matriz de multiprocessadores de streaming (SM, Streaming Multiprocessors), e cada SM contém oito núcleos de processador, também chamados de processadores de fluxo (SP, Streaming Processor) ou processadores de thread (TP, Thread Processor). Cada SM também inclui processadores de filtragem de textura para modo gráfico, também usados para diversas operações de filtragem em modo de computação.
Abaixo está um diagrama de blocos da GeForce 280 GTX no modo gráfico tradicional.

Mudando para o modo de computação, o gerenciador de threads de hardware (acima) gerencia os threads TPC.

Uma análise mais detalhada do cluster TPC: memória distribuída para cada SM; Cada núcleo do processador SM pode distribuir dados entre outros núcleos SM através de memória distribuída, sem a necessidade de acessar um subsistema de memória externo.
Assim, o sombreador unificado e a arquitetura do computador NVIDIA usam dois modelos de computação completamente diferentes: para operação TPC é usado MIMD (instrução múltipla, dados múltiplos), para cálculos SM - SIMT (instrução única, thread múltiplo), uma versão avançada, SIMD (single instrução, dados múltiplos).
Em relação às características gerais, em comparação com as gerações anteriores de chips, a família GeForce GTX 200 apresenta as seguintes vantagens:
Capacidade de processar três vezes mais fluxos de dados por unidade de tempo
Novo design do agendador de comandos, com eficiência de processamento de textura aumentada em 20%
Interface de memória de 512 bits (384 bits na geração anterior)
Processo otimizado de amostragem z e compactação para obter melhores resultados de desempenho em tamanhos de tela altos
Melhorias arquitetônicas para melhorar o desempenho do processamento de sombras
Combinação de buffer de quadro em velocidade total (versus meia velocidade no 8800 GTX)
Duplique o buffer de comando para melhorar o desempenho computacional
Dobre o número de registros para processamento mais rápido de shaders longos e complexos
Dados de ponto flutuante de dupla precisão de acordo com o padrão de versão IEEE 754R
Suporte de hardware para espaço de cores de 10 bits (somente DisplayPort)
Esta é a lista das principais características dos novos chips:
Suporte NVIDIA PhysX
Suporte para Microsoft DirectX 10, Shader Model 4.0
Suporte para tecnologia NVIDIA CUDA
Suporte ao barramento PCI Express 2.0
Suporte à tecnologia GigaThread
Motor NVIDIA Lumenex
Ponto flutuante de 128 bits (HDR)
Suporte OpenGL 2.1
Suporte DVI de link duplo
Suporta tecnologia NVIDIA PureVideo HD
Suporte à tecnologia NVIDIA HybridPower
É observado separadamente que DirectX 10.1 não é compatível com a família GeForce GTX 200. O motivo apresentado foi o fato de que ao desenvolver chips de uma nova família, após consultas com parceiros, decidiu-se focar não no suporte ao DirectX 10.1, que ainda é pouco procurado, mas na melhoria da arquitetura e desempenho dos chips.
Baseado no pacote de física, o NVIDIA PhysX é um poderoso mecanismo de física em tempo real, atualmente suportado por mais de 150 jogos. Combinado com o poderoso GPU, o motor PhysX fornece um aumento significativo no poder de computação física, especialmente em momentos como a criação de explosões com dispersão de poeira e fragmentos, personagens com expressões faciais complexas, novos tipos de armas com efeitos fantásticos, tecidos vestidos ou rasgados de forma realista, neblina e fumaça com fluxo dinâmico ao redor de objetos.
Muitos desenvolvedores e desenvolvedores de jogos há muito se esforçam para implementar efeitos físicos nos jogos. A cada ano essa direção se torna cada vez mais relevante. Nos jogos modernos, a interação dos objetos com o ambiente é realizada por meio dos dois motores que mais ganharam popularidade - Havok e PhysX.
Havok é o motor mais antigo no qual muitos jogos para PC e consoles são escritos. Em 2006, a então independente ATI demonstrou a aceleração de efeitos físicos usando placas de vídeo Radeon X1900XT. No entanto, o Havok foi posteriormente comprado pela Intel, que afirmou que os efeitos físicos seriam calculados por este mecanismo usando processadores.

O PhysX foi desenvolvido pela AGEIA, que implementou a “física” com aceleradores de sua própria concepção. Mas aconteceu que, apesar da grande popularidade deste motor entre os desenvolvedores de jogos, a implementação de efeitos físicos em jogos usando aceleradores especializados acabou sendo muito controversa.
E no ano passado, a NVIDIA comprou a AGEIA PhysX. Foi feita uma declaração de que através da otimização do driver o mecanismo PhysX será adaptado para uso com placas de vídeo GeForce 8800GT e superiores.
Outra inovação importante são os novos modos de economia de energia. Graças ao uso de uma tecnologia de processo de precisão de 65 nm e novas soluções de circuito, foi possível obter um controle mais flexível e dinâmico do consumo de energia. Assim, o consumo da família de chips gráficos GeForce GTX 200 em modo de espera ou em modo 2D é de cerca de 25 W; durante a reprodução de um filme Blu-ray em DVD, cerca de 35 W; sob carga 3D completa, o TDP não excede 236 W. O chip gráfico GeForce GTX 200 pode ser completamente desligado graças ao suporte da tecnologia HybridPower em placas-mãe com chipsets HybridPower nForce com gráficos integrados (por exemplo, nForce 780a ou 790i), enquanto o fluxo gráfico de baixa intensidade é simplesmente calculado. GPU, integrado à placa do sistema. Além disso, GPU A série GeForce GTX 200 também apresenta módulos dedicados de gerenciamento de energia projetados para desligar unidades de GPU que não estão em uso no momento.

O usuário pode configurar um sistema baseado em duas ou três placas de vídeo da família GeForce GTX 200 no modo SLI ao utilizar placas-mãe baseadas nos chipsets nForce correspondentes. No modo SLI padrão tradicional (com duas placas de vídeo), é declarado um aumento de aproximadamente 60-90% no desempenho dos jogos; no modo SLI de 3 vias – o número máximo de quadros por segundo com tamanhos máximos de tela separados.
Como parte do anúncio da nova série da família de processadores gráficos GeForce GTX 200, a NVIDIA oferece uma visão completamente nova do papel dos processadores centrais e gráficos em um sistema de desktop moderno e balanceado. Um PC tão otimizado, baseado no conceito de computação heterogênea (ou seja, computar um fluxo de tarefas heterogêneas de diferentes tipos), segundo especialistas da NVIDIA, possui uma arquitetura muito mais equilibrada e um potencial computacional significativamente maior. Refere-se à combinação de um processador central com desempenho relativamente moderado com os gráficos mais poderosos ou mesmo um sistema SLI, que permite atingir o desempenho máximo nos jogos, 3D e aplicações multimédia mais exigentes.
A propósito, a computação intensiva usando placas gráficas modernas não é novidade, mas com o advento da família de processadores gráficos GeForce GTX 200, a NVIDIA espera um aumento significativo no interesse pela tecnologia CUDA.
CUDA (Compute Unified Device Architecture) é uma arquitetura de computação destinada a resolver problemas complexos nas esferas de consumo, negócios e técnica - em qualquer aplicativo com uso intensivo de dados usando GPUs NVIDIA. Do ponto de vista da tecnologia CUDA, o novo chip gráfico GeForce GTX 280 nada mais é do que um poderoso processador multi-core (centenas de núcleos!) Para computação paralela.
Como mencionado acima, o núcleo gráfico da família GeForce GTX 200 pode ser pensado como um chip que suporta modos gráficos e de computação. Em um desses modos - “computação”, a mesma GeForce GTX 280 se transforma em um multiprocessador programável com 240 núcleos e 1 GB de memória dedicada - uma espécie de supercomputador dedicado com desempenho teraflop, o que aumenta significativamente a eficiência de trabalhar com aplicações que paralelizam bem de dados, por exemplo, codificação de vídeo, computação científica, etc.
As GPUs das famílias GeForce 8 e 9 foram as primeiras do mercado a suportar a tecnologia CUDA, já venderam mais de 70 milhões de unidades e o interesse no projeto CUDA não para de crescer. Você pode aprender mais sobre o projeto e baixar os arquivos necessários para começar aqui. A título de exemplo, as capturas de tela abaixo mostram exemplos de ganhos de desempenho computacional obtidos por usuários independentes da tecnologia CUDA.

Comparado com a líder anterior GeForce 8800 GTX, o novo processador carro-chefe GeForce GTX 280 tem 1,88 vezes mais núcleos de processador; capaz de processar aproximadamente 2,5 threads a mais por chip; tem o dobro do tamanho dos registros de arquivo e suporte para cálculos de ponto flutuante de dupla precisão; suporta 1 GB de memória com interface de 512 bits; equipado com um gerenciador de comando mais eficiente e recursos aprimorados de comunicação entre os elementos do chip; buffer Z aprimorado e módulo de compactação, suporte para paleta de cores de 10 bits, etc.
Pela primeira vez, a nova geração de chips GeForce GTX 200 é inicialmente posicionada não apenas como um poderoso acelerador gráfico 3D, mas também como uma solução computacional séria para computação paralela.
Características da NVIDIA GeForce GTX 280
| Nome | GeForce GTX 280 |
| núcleo | GT200 (D10U-30) |
| Tecnologia de processo (µm) | 0.065 |
| Transistores (milhões) | 1400 |
| Frequência central | 602 |
| Frequência operacional da memória (DDR) | 1107 |
| Tipo de barramento e memória | GDDR3 512 bits |
| Largura de banda (Gb/s) | 141,67 |
| Unidades de shader unificadas | 240 |
| Frequência da unidade de shader unificada | 1296 |
| TMU no transportador | 80 |
| ROP | 32 |
| Modelo de sombreador | 4.0 |
| Taxa de preenchimento (Mtex/s) | 48160 |
| DirectX | 10 |
| Interface. | PCIe 2.0 |
Não houve revolução, o novo processador gráfico GT200 e a placa de vídeo GeForce 280GTX (285GTX, 295GTX) testada hoje são desenvolvimentos adicionais da arquitetura unificada de shaders da NVIDIA. O novo processador gráfico contém mais unidades funcionais do que seus antecessores, o que lhe dá o direito de ser considerado o mais poderoso. GPU por hoje.




