En nuestro artículo sobre el lanzamiento de los nuevos GPUs AMD Radeon HD 7770 y Radeon HD 7750 comentábamos que la nueva Radeon HD 7770, descontando sus diferencias arquitectónicas, en cuanto a especificaciones lucía muy similar a la Radeon HD 6770/5770; pero que debido a su arquitectura más moderna y mayores clocks, la nueva Radeon HD 7770 la supera consistentemente; pero ¿podrá superarla si ambas estuvieran configuradas a iguales frecuencias?.
Gracias a los de HT4U podremos despejarnos dicha duda, pues tuvieron la genial idea de configurar a la nueva Radeon HD 7770 a la misma frecuencia de la Radeon HD 6770, y realizar una comparativa a fin de comprobar cuanto rendimiento adicional provee la nueva arquitectura Graphic Core Next ante la longeva arquitectura VLIW5 (o VLIW 5D).
En el artículo sobre el lanzamiento de las Radeon HD 7700 Series comentábamos ligeramente sobre las similitudes entre ambos chips (Cape Verde y Juniper) en cuanto a sus especificaciones enfocadas a los juegos; y antes de continuar con la comparativa de HT4U profundizaremos un poco sobre ambas arquitecturas; para lo que lamentablemente a partir de aquí nos pondremos algo técnicos, pero tratando de simplificar los términos con fines “didácticos”.
Arquitectura VLIW5/VLIW 5D
Esta arquitectura está basada en el uso de procesadores VLIW conformados por 4 ALUs (unidades de procesamiento de enteros) y una SFU (Special Function Unit), donde cada uno de los 4 ALUs es usado para calcular los canales de color de cada pixel RGBA: rojo, verde, azul, y alfa (transparencia), es decir cada uno de los pixels mostrados en la pantalla es “dibujado” por estas unidades en conjunto con otras unidades del chip como las unidades de textura y ROPs; la unidad SFU es usada para realizar cálculos por así llamarlos “complejos” usando además el poder combinado de los 4 ALUs para poder ejecutar operaciones de punto flotante de 32 y 64 bits (doble precisión) esto es usado mayormente en cómputo GPGPU y no en juegos.
Podríamos aprovechar esta breve explicación para detallar a la arquitectura VLIW4/VLIW-4D, donde los ALUs son un poco más por así decirlo “robustos” y pueden suplir por su cuenta a la unidad SFU, haciéndola innecesaria, por lo que cuentan únicamente con 4 ALUs.
16 de estos procesadores VLIW conforman un motor SIMD (SIMD Engine), unidad de cálculo que reúne a 64 ALUs (16×4) y 16 SFUs (16×1), esto es para VLIW5; si quisiéramos referirnos a VLIW4 serían únicamente 64 ALUs. La unidad SIMD realiza cálculos a los que AMD denomina WaveFront; y si juntamos varios motores SIMD tenemos un GPU basado en la arquitectura VLIW5 (también se aplica a VLIW4).
La arquitectura Graphic Core Next
Con Graphic Core Next AMD rediseña por completo sus unidades de cálculo esta vez usando unidades vectoriales conformadas por 16 ALUs, 4 unidades vectoriales juntas conforman un Compute Unit (CU), el cual reúne a 64 ALUs, y es capaz de ejecutar un WaveFront por ciclo (se espera que las versiones FirePro y FireStream puedan ejecutar 10 WaveFronts por ciclo en cada CU). Podríamos decir que un CU o shader GCN como los denomina AMD, equivale a un motor SIMD de la vieja arquitectura VLIW.
A su vez, los Compute Units (CU) están agrupados en valga la redundancia grupos de 4 unidades que conforman un Compute Unit Array (CUA); varios CUAs conforman un GPU basado en la arquitectura Graphic Core Next (GCN).
Cabe mencionar que aunque las unidades vectoriales pueden cumplir con las mismas funciones que las unidades VLIW en cuanto a juegos (calcular los canales de color de los pixels), son más robustas en cuanto a la ejecución de cálculos de punto flotante, por lo que su rendimiento bajo cómputo GPGPU es muy superior, y esta característica debe notarse tanto en aplicaciones aceleradas por GPU, físicas aceleradas por GPU (Bullet Physics), así como en juegos que hagan uso intensivo de compute shaders (como Civilization, Battlefield 3, y otros juegos por venir), o en teselado (GCN incorpora un motor de teselado de 9º generación), y encoding/decoding acelerado por GPU (gracias a su unidad dedicada VCE).
VLIW5 vs Graphic Core Next
Para esta comparativa los de HT4U configuraron al GPU AMD Radeon HD 7770 a 850Mz y su memoria gráfica a 1200MHz, con lo que igualan las frecuencias con el GPU Radeon HD 6770; lo cual nos sirve para comparar ambas arquitecturas, pues coincidentemente ambas cuentan con 10 SIMDs/CUs, 40 unidades de textura, y 16 ROPs; lo cual se presta para evaluar cual de las 2 arquitecturas tiene mayor poder de cálculo/gráfico a las mismas especificaciones.
Según las pruebas de HT4U, la Radeon HD 7770 configurada a las frecuencias de la Radeon HD 6770 (Radeon HD 7770@6770) derrota en la mayor parte de los test a la Radeon HD 6770, mostrando una superioridad de 37.5%, aunque también pierde en algunas pocas ocasiones, por hasta un despreciable 1.8%; pero promediando las 34 pruebas tenemos que la Radeon HD 7770@6770 supera en promedio a la Radeon HD 6770 por 12.72%.
En cómputo GPGPU la superioridad es de 28.4%, la cual es una buena diferencia, la que al parecer indica que el principal objetivo de la nueva arquitectura Graphic Core Next (mejorar el poder de cálculo) se ha cumplido.
Pueden apreciar todas las pruebas realizadas en la web de HT4U.