ANÁLISE: AMD Ryzen Threadripper 2990WX

A modularidade Ryzen em seu ápice mostra também suas limitações

[+update #2 - 19/09/2018]: A NVIDIA através dos drivers GeForce 399.24 corrigiu um problema que limitada o desempenho do processador AMD Threadripper 2990WX em games, a grosso modo foi necessário informar para o driver que o processador tinha 32/64 núcleos/threads. Já adicionamos os novos testes nos comparativos.

[+update #1]: Como prometido, nos aprofundamos na performance do Threadripper 2990WX em seus modos de compatibilidade, com situações em que ele é parcialmente desabilitado buscando mais desempenho em algumas aplicações. O artigo está disponível nesse link.

[+texto original]:O AMD Ryzen Threadripper 2990WX é um processador de alto desempenho voltado a produtores de conteúdo e profissionais que precisam de uma quantidade massiva de poder de processamento, especialmente focado em ciclos de trabalho que tirem benefícios de quantidades enormes de núcleos e threads. Para isso essa CPU chega equipada com 32 núcleos e, via SMT, chega a 64 threads, uma contagem impressionante para um produto desse segmento de preço.

Site oficial do AMD Ryzen Threadripper 2990WX

Menos é mais: os saltos em desempenho do Threadripper 2990WX quando é parcialmente desabilitado

Seguindo o update dos produtos Ryzen, a AMD apresentou a segunda geração de CPUs Ryzen Threadripper. O primeiro update é bastante óbvio: a empresa implementou a microarquitetura Zen+ em seus modelos high-end, trazendo a litografia em 12 nanômetros. O efeito dessa mudança é semelhante ao alcançado nos demais Ryzen 2000: reduziu o consumo do chip, então é possível entregar frequências mais altas mantendo níveis semelhantes de alimentação de energia e aquecimento.

Mas além da atualização esperada, os novos Threadrippers trazem outra novidade. Enquanto a primeira geração habilitou apenas dois dies Ryzen (criando até curiosos rumores sobre supostos outros dois dies funcionais desligados) a nova geração introduz uma nova linha que possui todos os 4 dies funcionais, chamada Threadripper WX. O W aqui atende por Workstation, e já indica que tipo de uso que a AMD direciona esses processadores.

É com essa mudança que a contagem de núcleos subiu para até 32 núcleos (resultado de 4 dies octa-core Ryzen combinados), e através do Simultaneous Multithread (SMT) o modelo mais potente da linha, o Ryzen Threadripper 2990WX, traz a contagem impressionante de 64 threads.

Site oficial do AMD Ryzen Threadripper 2990WX

Comparativo


AMD Ryzen Threadripper 2990WX

AMD Ryzen Threadripper 2970WX

AMD Ryzen Threadripper 1950X

AMD Ryzen 7 2700X

Preços

Preço no lançamentoU$ 1.799,00 U$ 1.299,00 U$ 999,00 U$ 329,00
Preço atualizadoR$ 9.650,00 R$ 7.200,00 U$ 999,00 R$ 1.750,00

Especificações

Canais de memóriaquad-channel quad-channel quad-channel dual-channel
Conjunto de instruções64-bit 64-bit 64-bit 64-bit
Multiplicador desbloquadoSim Sim Sim Sim
Número de núcleos32 24 16 8
Processo de fabricação12nm 12nm 14nm 12nm
SocketTR4 TR4 TR4 AM4
Threads64 48 32 16
CodinomePinnacle Ridge (4x) Pinnacle Ridge (4x) Zen Pinnacle Ridge
TDP250 250 180 105
Cache L364 64 32 20
Clock3000 3000 3400 3700
Clock (Turbo)4200 4200 4000 4300
Memórias suportadasDDR4 DDR4 DDR4 DDR4
PCI Express3.0 3.0 3.0 3.0
Canais PCI Express64 64 64 24

Vídeo Integrado

GPUSEM VÍDEO INTEGRADO SEM VÍDEO INTEGRADO SEM VÍDEO INTEGRADO SEM VÍDEO INTEGRADO

Características Gerais

Acompanha cooler?Não Não Não Sim, Wraith Prism Led

Tecnologias Threadripper

A segunda geração dos processadores Zen chega pouco mais de um ano após o lançamento dos primeiros produtos. Diferente da geração 1, não temos aqui um salto tecnológico com os impressionantes 3.7x mais poder de processamento por watt consumido ou o saltos em IPC de 50%, como aconteceu na primeira geração. Temos agora um modesto "refresh" da linha Ryzen, o Zen+, e as maiores inovações vão ficar para o Zen2 em 7nm.

A segunda geração Ryzen traz um
refresh modesto na microarquitetura

A principal novidade da segunda geração é o uso de uma nova litografia, os 12 nanômetros LP da GlobalFoundries (LP atende por "leading performance", uma marca utilizada na tecnologia que parece ter sido pensada pelo pessoal do marketing). A redução na litografia possibilita maior densidade de transistores e responde por uma performance entre 10 a 15% superior, segundo a AMD.

Novidades incluem mais performance, menor consumo,
clocks mais altos e latências mais baixas

O 12nm LP também viabilizou clocks mais alto, sendo que com essa nova tecnologia, a AMD afirma que há um ganho na casa dos 300MHz comparado a geração anterior, chegando a casa dos 4.3GHz em apenas um núcleo e conseguindo até 4.2GHz em todos os núcleos em situações de overclock.

Algumas tecnologias foram refinadas na segunda geração Ryzen, entre elas a segunda geração do Precision Boost. Essa tecnologia utiliza uma série de sensores que verificam consumo e aquecimento em tempo real e ajustam as frequências com mudanças precisas de 25MHz buscando o ponto ideal. O Precision Boost 2 agora busca manter frequências mais altas mesmo em funções que precisam de múltiplos núcleos, segurando os clocks em níveis mais altos enquanto for possível respeitar limites de temperatura e consumo de energia. A nova geração dessa tecnologia também possibilita a troca mais suave da contagem de núcleos ativos e suas frequências de operação, fazendo com que o clock cai gradativamente, na medida que mais cores são colocados em ação.

Na mesma balada, o Extended Frequency Range (XFR) também ganhou melhorias. Essa tecnologia aumenta os clocks de acordo com as possibilidades do sistema de resfriamento, colocando frequências mais altas se os sensores indicarem que a temperatura está baixa. Isso faz com que investir em um cooler mais potente e eficiente se reflita em ganhos maiores de desempenho, já que o XFR2 vai aumentar as frequências buscando aproveitar a margem maior térmica. Na demonstração da AMD há um ganho de 7% na performance após trocar um cooler básico por um Noctua NH-D15S.

Artigo: As tecnologias dos processadores Ryzen

No restante, esses produtos herdam outras tecnologias desenvolvidas na primeira geração como o Neural Net Prediction e o Smart Prefetch. Vocês podem ver mais sobre essas tecnologias da primeira geração Ryzen nesse artigo aqui.

Threadrippers geração 2

Com dois dies a mais, a distribuição dos canais de memória se tornou crítico nos modelos WX. A AMD afirma ter buscado a abordagem que se mostrou mais estável e consistente para o ecossistema. Então a estrutura inicial foi mantida: dois dies possuem dois canais de comunicação cada. O problema que surge é óbvio, já que isso significa que dois dies Zen não possui um canal de comunicação direto com as memórias, precisando fazer o caminho através dos outros dois dies, algo que inevitavelmente vai impactar no tempo que esses núcleos vão demorar para ter acesso a dados na RAM, a famigerada latência que vem sendo uma deficiência dos processadores Ryzen frente a modelos rivais.

Dois dies Ryzen não tem acesso direto às memórias nos modelos Threadrippers WX

A otimização que pode ser feita para contornar essa deficiência é dar a preferência para usar primeiro os dois dies que tem acesso mais rápido às memórias. Isso não é pouca coisa: você vai precisar ultrapassar o uso de 16 núcleos para começar a necessitar de núcleos com acesso mais lento às RAM. Segundo a AMD o sistema Windows já é capaz de realizar essa otimização, mas ainda existe espaço para melhorias no software.

Só é possível usar o modo NUMA 2990WX

Para viabilizar o acesso à memória RAM pelos dois outros dies, a AMD criou canais de comunicação entre todos os dies. Isso significa que todos os dies Zen presentes em um Threadripper WX possuem um canal direto de comunicação com duas vias para todos os demais dies no processador, criando os caminhos necessários para viabilizar a troca de informação presente nas memórias RAM entre todos os núcleos zen presentes nesse processador. Ao total são 25GBps de largura de banda comunicando os dies se você utilizar a frequência 1600MHz nas memórias, e essa largura de banda busca garantir que se um die precisar de algo "na memória de outro", não se forme gargalos.

Por conta da estrutura do Threadrippers WX também foi limitado os modos de operação das memórias, funcionando apenas em NUMA ou como a AMD chama, o Modo Local. O NUMA melhora a latência ao colocar os dados na memória RAM com comunicação direta com o die em uso, ao invés de tentar usar toda a RAM disponível. A linha Threadripper 2000X mantém a alternância entre NUMA e UMA, então o consumidor pode optar por melhor largura de banda (indicado para aplicações de renderização) trocando para o UMA, ou Modo Distribuído, como a AMD chama, e que irá tentar usar de forma homogênea toda a memória disponível.


Sistema utilizado
Abaixo, detalhes sobre o sistema utilizado para os testes.

Máquinas utilizadas nos testes:
Todas os sistemas utilizaram componentes com mesmas características técnicas para os testes, com exceção da placa-mãe/processador que varia de acordo com a plataforma, veja a configuração utilizada:

- Placa-mãe para o CPU analisado: Gigabyte X399 AORUS XTREME [site oficial]
- Placa de vídeo: Gigabyte GeForce GTX 1080 Ti AORUS Xtreme [análise]
- Memórias: 32 GB G.Skill Trident Z RGB @ 3200MHz (4x8GB) [site oficial]
- SSD: Kingston Savage 240GB Sata 6Gb/s [análise]
- HD: Seagate Barracuda 2TB 7200RPM Sata 6Gb/s [site oficial]
- Cooler: Cooler Master Ripper (2990WX e 1950X) Noctua NH-U12S (7900X) [site oficial]
- Fonte de energia (PSU): Thermaltake Toughpower 850W GOLD [site oficial]

Refizemos todos os testes dos CPU´s agora com uma 1080 Ti

Sistema Operacional e Drivers:
- Windows 10 64 Bits com Updates
- GeForce 398.98

Aplicativos/Games:
- 7-Zip 18.05 [site oficial]
- Adobe Premiere CC 2018 [site oficial]
- AIDA64 [site oficial]
- Blender [site oficial]
- CineBench R15 [site oficial]
- x264 Full HD Benchmark [download]
- V-Ray [site oficial]
- wPrime 1.55 [site oficial]

- 3DMark (DX11) [site oficial]
- Assassin´s Creed Origins (DX11)
- Battlefield 1 (DX11)
- Grand Theft Auto V (DX11)
- The Division (DX12)
- The Witcher 3 (DX11)

CPU-Z/AIDA64
Através do CPU-Z e AIDA64 vemos algumas informações técnicas do processador, como modelo, clocks, número de núcleos e threads etc. Confiram abaixo as telas principais dos dois aplicativos:

Abaixo colocamos lado a lado a tela principal do CPU-Z mostrando as especificações do TR 2990WX, TR 1950X e i9-7900X.


​Overclock


Colocamos todos os núcleos do Threadripper 2990WX em 4.1GHz, sendo esse um clock interessante por não forçar demais o CPU. A tensão utilizada foi de 1.41v, abaixo disso o sistema não finalizou todos os testes.


Em nossos testes dos modelos TR4 o cooler utilizado foi o Wraith Ripper, enviado pela AMD

Ganhos interessantes em algumas aplicações

Como se sabe, overclock não é uma ciência exata, então um sistema com mesmos componentes pode se comportar de forma diferente mesmo com o mesmo overclock aplicado, no caso dos resultados, veremos que em alguns casos o resultado foi muito bom, em outro derrubou o desempenho. As memórias mantivemos em 3200MHz, a frequência máxima via XMP.

"FAÇA OVERCLOCK POR SUA CONTA E RISCO"


Consumo de energia


Fizemos os testes de consumo de energia do sistema em modo ocioso e rodando o 3DMark, aplicativo que exige bastante do sistema.

É importante destacar que o consumo de energia depende bastante da placa-mãe e pode variar consideravelmente de um sistema para outro com configurações semelhantes.

IDLE (Sistema ocioso)
Começamos pelo teste com o sistema em modo ocioso.

Rodando o 3DMark
Quando colocamos os sistemas rodando o 3DMark, temos os consumos abaixo:


Temperatura


Começamos pelos testes de temperatura, como o sistema em modo ocioso e rodando o wPrime, aplicativo que "estressa" todos os núcleos dos processadores.

IDLE (Sistema ocioso)
Começamos pelo teste com o sistema em modo ocioso, com o Windows em espera sem estar executando nenhuma tarefa além das tradicionais do sistema.

Rodando o wPrime
Quando colocamos os sistema rodando o aplicativo wPrime, que faz todos os núcleos trabalhem em modo full, temos os consumos abaixo:

"A temperatura varia de acordo com o programa utilizado, mesmo o wPrime estressando todos os núcleos sendo uma boa opção para ver o comportamento desse cenário, alguns programas podem exigir ainda mais do processador e consequentemente esquentar mais o mesmo, como exemplo citamos o Blender."


Testes de aplicações profissionais


Abaixo temos uma série de testes de desempenho com o sistema, comparando o processador analisado com outros modelos do mercado e fazendo exatamente os mesmos testes.

Alguns testes podem tirar maior proveito de CPUs com clocks mais altos,
independente da arquitetura e do número de núcleos/threads,
já outros podem tirar mais proveito de mais núcleos/threads

AIDA64 Latency
O software AIDA64 tem vários testes de performance, separamos um que mostra um cenário diferente dos demais, a velocidade de latência das memórias, que quanto menor o resultado, melhor.

Adobe Premiere CC 2018
Utilizamos o Media Encoder para realizar a renderização de um projeto do Premiere, sendo uma versão adaptada do projeto usado no vídeo "PC Ideal encara o Monster Hunter World". No projeto usamos múltiplas funcionalidades como colorometria das cenas, filtros de nitidez, sobreposição e arranjos de múltiplos clipes na tela e também lettering, tudo com o intuito de buscar dar trabalho para o processador. Nesse teste a aceleração através da placa de vídeo fica desabilitada, garantindo que os recursos do processador sejam o responsável pela execução da tarefa.

ATUALIZAÇÃO 29/08/2018 - 16:45 - Corrigimos o teste do Core i9-7900X que estava utilizando o resultado de renderização com a placa de vídeo, agora o teste considera o cenário correto, utilizando o tempo de renderização via software, usando o processamento do CPU para a tarefa.

Blender
O aplicativo Blender é voltado a profissionais de edição de filmes e para manipulação de objetos 3D, sendo um bom teste real de como o sistema se comporta nesse tipo de cenário.

V-Ray
Ferramenta de benchmark desenvolvida pela Chaos Group, empresa atuante no mercado de computação visual de alta qualidade, o teste V-Ray Benchmark utilizado consiste no resultado de renderização do CPU, quanto menor for, melhor é o desempenho.

x264 Full HD Benchmark
Essa ferramenta é um importante comparativo de performance que mede a capacidade do sistema em realizar a renderização usando o popular codec x264 na resolução FullHD, um teste que tem como principal carga um alto uso de processador. A aplicação mede a velocidade que o hardware é capaz de realizar a codificação em x264, sendo que quanto mais rápido, melhor. Aqui temos os seguintes resultados:

HWBot x265 Benchmark
Com o aplicativo de benchmark de renderização do HWBot, temos um teste renderizando com codec x265, tanto em FullHD como em 4K: Assim como o teste com o x264, quanto mais rápido o sistema for para realizar o teste, melhor.

CineBENCH R15
O CineBench está entre os mais famosos testes de benchmarks para processadores, baseado em um teste convertendo uma imagem. Ele é baseado na plataforma Cinema 4D da MAXON, bastante relevante no meio de produção de conteúdo em 3D e com uso extensivo em filmes de grande bilheteria do cinema mundial.

WinRAR
Outro bom teste para medir o comportamento do processador é o WinRAR, que consegue fazer bom uso de todos os cores. A AMD tem apresentado resultados bem ruins nesses testes quando comparados com a Intel.

7-Zip
O aplicativo 7-Zip se tornou muito popular e hoje é um dos mais utilizados no mundo quando o assunto é compressão de arquivos, sendo outro bom teste para desempenho dos processadores trazer alta carga de estresse para o CPU.

wPrime
Rodando o wPrime, teste que estressa todos os cores do processador, temos os resultados abaixo:

3DMark
Começamos nossos testes com foco em vídeo com o 3DMark, mas por enquanto com a placa de vídeo dedicada.


Teste em games


Agora vamos para os games, selecionamos alguns dos principais títulos do mercado para mostrar como os processadores se comportam utilizando configurações semelhantes, sendo sempre a mesma placa de vídeo, uma GTX 1080 Ti AORUS Xtreme (versão overclockada), e 32GB de RAM 3200MHz através de 4 módulos de 8GB. Damos preferência a games que trazem alta carga ao processador, buscando testar as situações onde a CPU é realmente mais relevante que a GPU para a taxa de quadros alcançada.

O artigo mostrando como jogar "bem" com
o Threadripper 299WX sairá nos próximos dias

Assassin´s Creed Origins
Assassin's Creed Origins representa o retorno da importante franquia após uma pausa de dois anos. O jogo desenvolvido pela Ubisoft Montreal utiliza o motor gráfico AnvilNext 2.0 e é baseada em DX11, com belos gráficos que representam um desafio e tanto para placas de vídeo. Por conta da complexidade das cidades e vilarejos o jogo também não facilita a vida dos processadores, que passam trabalho para lidar com tanta arquitetura e também pessoas ativas pelo mapa.


Battlefield 1
Como um dos games com a melhor qualidade gráfica já lançados e com alta demanda de processador e placa de vídeo devido a seu mapa amplo e bastante destrutivo, agora o Battlefield 1 faz parte de nossa bateria de testes. Abaixo o comportamento dos sistemas rodando o game da DICE.


GTA V
Grand Theft Auto V está entre os maiores sucessos dos últimos anos, trazendo entre seus destaques boa qualidade gráfica. Ele é um dos games que mais faz uso do CPU, sendo um ótimo teste para ver o comportamento e diferença entre esse componente, além de ser muito exigente quando o assunto é latência de comunicação com as memórias. Confiram abaixo os resultados nesse game:


The Division - DX12
O game da Ubisoft é uma proposta bastante ambiciosa de criar uma Nova Iorque "viva" em partidas com multiplayer totalmente online. The Division usa um motor gráfico próprio desenvolvido pela Ubisoft Massive, e precisa lidar com cenários complexos e grandes quantidades de partículas na tela, com destaque para a neve que ocasionalmente cai em alguns momentos. Ele é nosso escolhido para o teste sobre a API DX12, já que tem uma das melhores implementações da nova tecnologia, realmente trazendo ganhos de desempenho comparado à versão com DX11.


The Witcher 3
The Witcher 3 foi lançado como referência em qualidade gráfica para PC, sendo um dos games mais interessantes da atualidade para medir desempenho de placas de vídeo e processador. Nesse teste temos um cenário diferente do que usamos em análises de placas de vídeo, visando forçar mais o processador, passando pela famigerada Novigrad. Abaixo os resultados dos sistemas comparados:

A AMD conseguiu escalar sua microarquitetura Ryzen a um novo patamar com o Ryzen Threadripper 2990WX, mas quando a contagem de núcleos chega a patamares tão elevados, as coisas começam a ficar complicadas. Enquanto modelos anteriores da família Threaripper mostravam avanços claros nas aplicações que exploram grande quantidades de núcleos e resultados apenas regulares em outros softwares, o 2990WX chega no nível de implementação da modularidade do Ryzen em que começa a ser comprometida algumas capacidades da plataforma.

Menos é mais: os saltos em desempenho do Threadripper 2990WX quando é parcialmente desabilitado

A modularidade da arquitetura Zen começa a mostrar seus limites no 2990WX

Isso resulta em um produto com resultados inconstantes. Em alguns momentos ele entrega as performances impressionantes, com saltos que vão de 40 a 70% sobre a capacidade de um 1950X, mas em outros testes nós temos o oposto: ele não apenas perde para o modelo com metade da contagem de núcleos. Ele fica muito abaixo. Talvez o teste com o resultado mais emblemático é o 7-Zip, onde o 2990WX consegue ser ótimo (descomprimindo) e horrível (comprimindo) ao mesmo tempo.

A grande quantidade de núcleos trazem ganhos de desempenhos em alguns testes, em outros começam a comprometer a performance

Se por um lado manter o ecossistema Threadripper coeso é uma demonstração do respeito que a AMD tem por seus consumidores entusiastas que já gastaram (possivelmente bastante dinheiro) em uma placa-mãe X399, manter a estrutura com dual-channel para apenas dois dos quatro dies criou visíveis gargalos de comunicação para os outros 16 núcleos que não possuem comunicação direta, algo que só poderia ser resolvido com o uso de outra plataforma para viabilizar outra estrutura com mais canais de comunicação entre CPU e RAM. Infelizmente só com testes dessa plataforma hipotética poderíamos ter segurança de saber o quanto a opção por se manter fiel a plataforma atual penalizou o desempenho do 2990WX.

Ainda vamos nos aprofundar nos testes com esse produto, e em breve testaremos as capacidades dessa CPU quando desabilita metade de seus dies (artigo já está disponível nesse link), virando basicamente um Ryzen Threadripper 2950X (que também está em testes) no ajuste 1/2 ou o 1/4, quando pode chegar a usar apenas um die ser na prática um Ryzen 7 2700X. Antecipando alguns dos resultados que temos por aqui, optar por essas configurações trazem ganhos significativos de desempenho nesses momentos em que o 2990WX é sabotado por sua arquitetura complexa. Isso mostra um ponto importante desse produto: mesmo sendo um excelente processador, é preciso saber o que está fazendo com ele.

 

É preciso ter clareza se o 2990WX é eficiente para seu ciclo de trabalho para que ele compense

Enquanto os Threadrippers da serie X ainda garantem um bom desempenho mesmo nos testes em que não se destacam, o 2990WX chega a ser péssimo em algumas aplicações que peguem em seus pontos fracos, então é preciso ser muito cauteloso antes de adquirir um produto desses. Em aplicações que seus pontos fortes são explorados, ele entrega algumas das melhores performances disponíveis no mercado, porém em outras ele é incapaz de manter o patamar de produtos bem mais baratos que ele. Mesmo em aplicações profissionais, que na teoria são seu uso ótimo, podemos nos deparar com resultados decepcionantes como o do Premiere.

Apesar de bons desempenhos em alguns momentos, a linha X dos Threadrippers parece ser o nível mais interessante para os consumidores em geral

O 2990WX é um produto que se destaca por trazer altíssima contagem de núcleos e threads por preços muito competitivos, aquecendo a disputa com a Intel e tornando mais viável a montagem de sistemas com essas configurações, porém a modularidade da microarquitetura Zen começa a apresentar deficiências nessa escala, e a combinação com 16 núcleos parece ser a mais indicada para o consumidor que precisa de um CPU poderoso para atividades como renderização ou processamentos complexos, mas que ainda depende de aplicações que precisam de latências baixas de memória (como jogos, por exemplo). Nesse caso, os Threadrippers da serie X ainda são uma opção mais segura, e em breve vamos ver o que a AMD conseguiu de melhorias com o Ryzen Threadripper 2950X, nosso próximo produto em análise.

Conclusão

 

Avaliação: AMD Ryzen Threadripper 2990WX

Tecnologias
10
Performance
9.0
Overclock
8.0
Preço
8.0

PRÓS
Altíssima contagem de núcleos e threads
Bom nível de aquecimento e consumo (considerando que tem 32 núcleos)
Compatível com a já existente plataforma X399
Versatilidade de operar com 32, 16 ou 8 núcleos
Altíssima performance em aplicações específicas
CONTRA
Desempenho comprometido em alguns softwares
Modularidade encontra limitações (dobro de núcleos não passam nem perto de entregar 100% de incremento no desempenho)
  • Redator: Fabio Feyh

    Fabio Feyh

    Fábio Feyh é sócio-fundador do Adrenaline e Mundo Conectado, e entre outras atribuições, analisa e escreve sobre hardwares e gadgets. No Mundo Conectado é responsável pelas análise de drones e alguns gadgets relacionados a fotos e vídeo, como Action Cams.

  • Redator: Diego Kerber

    Diego Kerber