A microarquitetura Zen representa um ponto crucial de mudança para a AMD e um marco em um mercado estagnado dos processadores para PCs domésticos. Após anos com apenas evoluções gradativas em novos produtos tanto de Intel quanto AMD, o “lado vermelho da força” traz a maior renovação para o mercado dos últimos tempos.

Artigo: AMD Bulldozer: O Bom, o Mau e o Feio

E há um bom motivo para isso: ela precisa. A última grande mudança da empresa foi a introdução dos processadores baseados na microarquitetura Bulldozer, que traziam um conceito de produtos com grandes quantidades núcleos e compartilhamento de recursos entre pares deles, o que ficou conhecido como módulo Bulldozer. Essa arquitetura não se mostrou eficiente no contexto da computação pessoal nos últimos anos, com muitos aplicativos fazendo péssimo uso de múltiplos núcleos e onde a capacidade de cada núcleo (performance em single thread) se mostrou mais determinante em muitos momentos do que a presença de multithreads abundantes. Os softwares não evoluíram para um uso eficiente de múltiplos núcleos, e o resultado foi catastrófico: vários anos em que a AMD simplesmente abandonou o segmento high-end, e até rolaram processos contra a empresa por "propaganda enganosa".

Os microprocessadores Zen, mais que uma evolução, são uma necessidade para a AMD

Nos últimos 4 anos, de forma discreta, a empresa “apagou o quadro” e começou do zero um novo chip. A prioridade era óbvia: precisava melhorar as instruções por clock (IPC) que seus processadores são capazes de executar, e com isso aumentar a capacidade de cada um dos núcleos. A meta era atingir um incremento impressionante de 40% comparado a geração passada, e a empresa foi capaz de exceder essa meta: a AMD afirma que um processador baseado em Zen é em torno de 52% mais eficiente que um modelo da geração anterior.

Os estreantes da arquitetura Zen, os modelos Ryzen 7 1800X, 7 1700X e 7 1700 mostram que além da preocupação com o IPC, a empresa não abandonou o conceito de uma quantidade vasta de núcleos: todos possuem oito núcleos, e com a introdução do Simultaneous Multithreading (SMT), uma tecnologia análoga ao Hyperthreading presente na Intel desde 2002, esses modelos são capazes de entregar um total de 16 threads (dois por núcleo), uma quantidade bastante rara no mercado de CPUs para consumidores domésticos.


Ryzen 7 1800X (Zen) e FX-9590 (Piledriver)

Os processadores Ryzen são baseados na nova microarquitetura Zen, fabricada na litografia de 14nm FinFET e uma estrutura completamente refeita, quando comparado com o que era feito com Bulldozers e microarquiteturas baseadas nela (Piledriver, Steamroller e Excavator). Na época do lançamento dos Bulldozers (2011), introduzidos com uma litografia de 32 nanômetros, havia limitações na capacidade de inserir múltiplos núcleos em um processador, e por conta dessas restrições, a AMD projetou um chip com recursos compartilhados entre os cores.


Diagrama da microarquitetura Bulldozer

A cada par de núcleos, foram compatilhados recusos de Fetch e Decode, assim como L2 Cache e FP Scheduler. O resultado: os núcleos não são alimentados com instruções de forma eficiente comparado a um sistema que dedique esses recursos para cada núcleo. Com uma litografia mais compacta em 14 nanômetros e outras evoluções tecnológicas, essa é a grande mudança de paradigma nos processadores baseados na microarquitetura Zen.

As tecnologias dos processadores Ryzen: clocks mais precisos, mais performance e capacidade de "predizer" o futuro

Além de um conjunto dedicado para cada núcleo, para "alimentar a besta" de forma mais eficiente, a AMD dedicou uma área de seu die para "predizer o futuro": a Neural Net Prediction usa algoritmos que "aprendem" os padrões dos dados que trafegam nos processamento, e começam a antecipar as demandas dos núcleos, colocando o próximo conjunto de dados necessários em um local apropriado para uso dos núcleos. Mas nem só através da adivinhação a empresa pretende inundar os núcleos de processamento com os dados que precisam: uma grande quantidade de memória cache foi introduzida, com um L2 Cache massivo de 512kb (o dobro que a concorrência) e com o L1 e L2 Cache com uma largura de banda 2x maior comparado com a geração passada.

No Zen a AMD consegue alimentar uma quantidade massiva de cores com instruções de forma ágil

Os núcleos de processamento compartilham o L3 Cache em grupos de quatro, formando o CPU Complex (CCX). Essa memória vai aumentar sua frequência para atingir o mesmo nível de desempenho do núcleo que estiver operando em maior performance. Todos os núcleos do CCX acessam qualquer área do L3 Cache com uma latência relativamente semelhante.

A melhoria na alimentação e distribuição dos dados pelas memórias do chip impacta também no consumo de energia do chip. Em um processador Excavator, apenas 31.6% da energia gasta é usada em "trabalho útil" do núcleo. Os outros 68,4% são gastos no "overhead", ações que são necessárias para iniciar o processamento, como por exemplo buscar os dados necessários e armazená-los nas memórias cache. Os microprocessadores Zen ampliaram o consumo de energia em "atividades úteis" para 42.6% do total da energia consumida.

Falando em consumo, como acontece com qualquer nova geração que traz reduções na litografia utilizada na fabricação há saltos na eficiência energética. Os Ryzen são 3.7x mais eficientes por watt consumido! Mas há outros elementos envolvidos na evolução da eficiência energética do Zen, sendo que a nova litografia responde por um incremento de 1.7x, a nova arquitetura atende por 1.3x e o design físico do chip mais eficiente atende por 2.29x.

Os microprocessadores Ryzen entregam 3.7x mais performance por watt consumido

O die Zen vem equipado com 48 monitores de consumo de alta velocidade (atualizados a cada milissegundo) e 20 monitores de temperatura, com um total de sensores que ultrapassa os 1000 por CCX. Isso possibilita outra tecnologia importante para sua eficiência: o Pure Power, que atende por os 1.4x restantes da evolução na relação performance por watt consumido.

Graças à sua alta precisão no monitoramento do die, com mais de mil sensores por núcleo, um microchip Zen consegue reagir de forma mais eficiente à demandas e pode alterar o funcionamento de seus núcleos de forma precisa. A frequência, por exemplo, pode ser alterada em incrementos de 25MHz, ao invés dos quatro estágios gerenciados pelo sistema operacional, como é feito em muitas CPUs hoje. Assim um microchip Zen pode atingir qualquer nível que achar o mais adequado para desempenhar a função que tem pela frente.

Com esse controle preciso, os microchips Zen também podem regular suas frequências para o nível ideal através do Precision Boost, ou inclusive exceder suas frequências padrão: o Extended Frequence Range (XFR) pode levar até dois núcleos para patamares acima do que o chip foi programado no modo Turbo, monitorando fatores como consumo e aquecimento para evitar que o chip ultrapasse níveis pré-programados. Assim o Ryzen 7 1800X pode levar sua frequência a 4.1GHz em dois núcleos mesmo com seu clock em Turbo Core sendo 4.0GHz. Quanto mais eficiente o sistema de resfriamento, mais longe o processador conseguirá chegar.

Todos os processadores Ryzen estão desbloqueados para overclock, o que significa que dá para levá-los além do Turbo Core ou mesmo o XFR. Mas para quem não pretende ficar mexendo em frequências e tensões elétricas, o XFR está disponível em todos os modelos e irá automaticamente fazer um uso do sistema de resfriamento, caso seja mais eficiente e entregue temperaturas mais baixas.

Se a introdução de mais performance por núcleo e o uso do Simultaneous Multithreading mostram a AMD seguindo um caminho mais próximo ao da Intel, o Pure Power e a alimentação dos núcleos com energia utiliza uma lógica diferente. A empresa equipou os chips Zen com o Low Drop-Out (LDO), uma tecnologia que é muito mais simples e ocupa menos área no die comparado ao Fully Integrated Voltage Regulator (FIVR) da Intel. Na apresentação, Mark Papermaster, CTO da AMD, foi bastante enfático ao afirmar que "o FIVR é bastante elegante em um artigo científico" porém, de acordo com executivo, o LDO e sua estrutura muito mais simples é mais eficiente a maior parte do tempo comparado com a solução da rival.

O LDO presente no Zen também é responsável pela maior eficiência no chip. Graças à grande quantidade de sensores presentes nos processadores Ryzen, ele consegue identificar os núcleos mais potentes e, de forma dinâmica, reduzir a tensão elétrica neles para equilibrá-los com os demais. Dessa forma, outros 5% de energia podem ser economizados nesses "núcleos prodígio" que passam a rodar em mesmo nível de performance que os demais, porém gastando menos.

Mas, chega de gráficos antipáticos de engenharia de microchips. O que o Ryzen consegue entregar na prática? Temos duas análises no ar com os estreantes da nova microarquitetura: o AMD Ryzen 7 1800X, o topo de linha, e o Ryzen 7 1700X, modelo mais modestos em clocks mas que traz um conjunto de recursos semelhantes a seu irmão mais potente.