- O design 3D HBM-on-GPU atinge densidade computacional recorde para cargas de trabalho exigentes de IA
- As temperaturas de pico da GPU ultrapassaram 140°C sem qualquer estratégia de mitigação térmica
- Reduzir pela metade a velocidade do clock da GPU reduziu as temperaturas, mas atrasou o treinamento de IA em 28%
Imec apresentou o estudo de um projeto 3D HBM-on-GPU com o objetivo de aumentar a densidade computacional para cargas de trabalho exigentes de IA no 2025 IEEE International Electron Devices Meeting (IEDM).
A abordagem de co-otimização da tecnologia do sistema térmico coloca quatro pilhas de memória de alta largura de banda diretamente no topo de uma GPU por meio de conexões microbump.
Cada pilha consiste em doze matrizes DRAM de ligação híbrida e o resfriamento é aplicado sobre os HBMs.
Testes de mitigação térmica e compensações de desempenho
A solução aplica mapas de potência derivados de cargas de trabalho relevantes para o setor para testar como a configuração responde sob condições realistas de treinamento de IA.
Este arranjo 3D proporciona um salto na densidade computacional e na memória por GPU.
Ele também oferece maior largura de banda de memória de GPU em comparação com a integração 2.5D, onde as pilhas HBM são colocadas ao redor da GPU em um interposer de silício.
No entanto, as simulações térmicas mostram sérios desafios para o projeto 3D de HBM em GPU.
Sem resfriamento, as temperaturas máximas da GPU atingiram 141,7°C, bem acima dos limites operacionais, e as linhas de base 2,5D atingiram 69,1°C sob as mesmas condições de resfriamento.
A Imec explorou estratégias de nível tecnológico, como integração de pilha HBM e otimização térmica de silício.
As estratégias de nível de sistema incluíram resfriamento bilateral e escalonamento de frequência de GPU.
A redução da velocidade do clock da GPU em 50% reduziu as temperaturas de pico abaixo de 100°C, mas essa mudança atrasou as tarefas de treinamento de IA.
Apesar dessas limitações, Imec afirma que a estrutura 3D pode oferecer maior densidade computacional e desempenho do que o projeto de referência 2,5D.
“A centralização da frequência do núcleo da GPU trouxe a temperatura máxima de 120°C para menos de 100°C, atingindo uma meta importante de desempenho de memória. Embora esta etapa venha com uma penalidade de carga de trabalho de 28%…” disse James Myers, Diretor do Programa de Tecnologia de Sistemas da Imec.
“…o pacote geral ultrapassa a linha de base 2.5D graças à maior densidade de transmissão oferecida pela configuração 3D. Atualmente estamos usando esta abordagem para explorar algumas configurações de GPU e HBM…”
A organização sugere que esta abordagem poderia suportar hardware termicamente resistente para ferramentas de IA em data centers densos.
O Imec apresenta este trabalho como parte de um esforço mais amplo para vincular as decisões tecnológicas ao comportamento do sistema.
Isso inclui um programa de cootimização entre tecnologias (XTCO) lançado em 2025 que combina o pensamento STCO e DTCO para alinhar roteiros tecnológicos com desafios de dimensionamento do sistema.
Imec disse que o XTCO permite a solução colaborativa de problemas em gargalos críticos em todo o ecossistema de semicondutores, incluindo empresas sem fábrica e de sistemas.
No entanto, estas tecnologias provavelmente permanecerão limitadas a instalações especializadas com orçamentos energéticos e térmicos controlados.
Através TechPowerUp
Siga o TechRadar no Google Notícias e adicione-nos como sua fonte padrão para receber notícias, opiniões e opiniões de nossos especialistas em feeds. Certifique-se de clicar no botão Continuar!
E é claro que você também pode Siga o TechRadar no TikTok para receber novidades, análises, unboxings em formato de vídeo e receber atualizações constantes nossas WhatsApp também









