Depois de Battlefield V e o Ray Tracing, agora é a vez de Final Fantasy XV e o DLSS trazerem mais uma estreia das tecnologias exclusivas das novas placas da série 20 da Nvidia. Dessa vez, porém, não são os RT Cores que são usados: para o novo efeito entram em ação outra porção do hardware que também foi introduzido nas Turing, os tensor cores, ou núcleos tensores.

Diferença visual e de performance do
Ray Tracing rodando nas RTX 2080 Ti e 2080

Enquanto os núcleos RT tem a finalidade de acelerar alguns processos do traçamento de luz e tornar viável o Ray Tracing em tempo real, os núcleos tensores são uma porção do hardware dedicado ao cálculo de matrizes e outras capacidades muito úteis para inteligência artificial e aprendizado da máquina. Essa capacidade tem uma aplicação bastante óbvia em situações como na computação de alta performance ou em servidores, onde ela é usada para, por exemplo, identificar pessoas nas fotos que foram subidas para a rede social, ou detectar automaticamente conteúdos impróprios. Mas... porque colocar isso em uma placa de vídeo?

O DLSS é um exemplo de como essa capacidade pode ser explorada também em games. O Deap Learning Super Sampling, ou superamostragem através de aprendizagem profunda (em uma tradução livre), é uma técnica de antisserrilhado que busca aproveitar essa porção introduzida nas placas Turing. Na essência ele não é muito diferente de outras técnicas como o MSAA, em que uma mostragem maior é realizada para definir qual cor cada pixel terá, mas ao aplicar inteligência artificial e aprendizado da máquina, as coisas mudam bastante.

O uso dos núcleos tensores para processar a imagem através de inferências trazem ao computador a capacidade de "preencher lacunas", e um bom exemplo desse uso do hardware é o vídeo abaixo, onde placas Tesla são usadas para tornar o efeito de slowmotion mais fluido com a adição de novos quadros criados através de IA. 

O DLSS faz algo parecido, mas ao invés de criar novos quadros, ele "estica" a imagem adicionando mais pixels e assim atingir um resultado final melhor acabado do que simplesmente renderizar sem nenhuma técnica de antisserrilhado. Na realidade, o resultado final é comparável até mesmo com o TAA, técnica mais avançada de antisserrilhado disponível FF XV.

As imagens abaixo são screenshots em 100% de uma imagem em 4K:

O cabelo do Noctis se mostrou um excelente espécime de testes de antisserrilhado, bem como a vegetação ou postes na parte de trás, no cenário. Não aplicar nenhum filtro faz uma verdadeira bagunça nas madeixas meio emo do protagonista, algo que o FXAA ameniza mas que só via TAA e DLSS ficam "sob controle".

A batalha fica clara entre o TAA e o DLSS, e cada uma das técnicas tem suas vantagens. O TAA usa informações de quadros anteriores para suavizar a imagem atual, o que pode gerar alguns artefatos em cenas com objetos se movendo de forma muito rápida. O DLSS tem um defeito evidente: em alguns pontos ele entrega menos definição, algo bastante perceptivel na região em torno dos olhos do protagonista nessas imagens comparativas. Isso é um efeito negativo desse redimensionamento do DLSS, já que em alguns momentos ele entrega mais nitidez que o TAA (como no lenço, no primeiro comparativo) e em outros deixa levemente borrado (cabelo e olhos de Noctis).

Com vantagens em alguns aspectos e problemas em outros,
o DLSS é comparável ao TAA

Mas as coisas vão realmente ficar interessantes em outro aspecto: a performance. Fizemos um rápido comparativo de desempenho, e o resultado é bem surpreendente:

O DLSS não apenas é 20% mais eficiente que o TAA e 13% melhor que o FXAA (que já é um filtro antisserrilhado bastante leve). Ele é também mais eficiente que não aplicar efeito de AA algum. Em nosso teste, ligar a técnica das placas Turing aumentou em 10% o desempenho comparado ao jogo sem nenhuma tecnologia de suavização de bordas, o que causa um efeito que, na minha memória, é inédito. Aplicar um filtro de melhora de qualidade gráfica também aumentou a performance.

DLSS consegue o feito de melhorar a qualidade gráfica
e aumentar a performance, ao mesmo tempo

O motivo desse efeito inesperado é que o DLSS não renderiza a imagem na resolução objetivo, nesse caso, em 4K. Como o hardware é capaz de ampliar de forma eficiente a imagem, as placas da série 20 podem renderizar o jogo em uma resolução menor e depois esticar até o 4K. Sei o quanto esse "esticar" gera polêmica especialmente nas discussões sobre consoles, com o "real 4K" sendo argumento versus sistemas que usam interpolação e outras técnicas para chegar ao UltraHD. Porém aqui o mais relevante é observar o resultado final, e apesar de alguns elementos terem um leve desfoque, a imagem como um todo tem uma qualidade bastante comparável a uma renderizada em 4K. De acordo com Alexandre Ziebert, do marketing técnico da Nvidia, inclusive dá para fazer uma estimativa de quanto foi reduzido na resolução de renderização baseado no ganho de performance, então podemos estimar que nosso teste foi renderizado em algo 10% menor, mais ou menos, do que a resolução 4K quando rodado com DLSS.

Isso torna o DLSS uma tecnologia muito mais atrativa da nova geração RTX. Enquanto o Ray Tracing é o "Santo Graal" da computação gráfica, mas dá sinais que ainda está em suas fases muito iniciais de implantação (alta carga em hardware, implementação bastante limitada em uma cena) o DLSS já chega trazendo melhorias evidentes e com poucos efeitos negativos na qualidade final da imagem. O novo filtro da empresa também tem outra vantagem: ele já possui uma biblioteca mais ampla de jogos que já anunciaram o suporte, o que inclui bastante títulos de peso como Player Unknow Battlegroud's, Hitman 2, Shadow of the Tomb Raider e Ark Survival Evolved. Dá para conferir a lista completa de games que confirmaram o suporte a essa tecnologia nesse link aqui.