Radeon HD 5870

radeon-hd-5870,0-O-224232-13.jpg

ATI è molto fiera della sua strategia “Sweet Spot”. Implementata per la prima volta l’anno scorso, Sweet Spot implica la realizzazione di una GPU in grado di soddisfare i requisiti del segmento di mercato più alto. Successivamente, l’impiego della GPU in una soluzione dual-processor gli permette di agguantare lo scettro di scheda grafica più veloce del mercato mentre, applicando il classico approccio, dalla GPU madre vengono ricavati i modelli potenzialmente inferiori per occupare tutti gli altri segmenti di mercato.

L’approccio Sweet Spot ha funzionato, per ora, molto bene, fin dalla presentazione dell’RV770. La Radeon HD 4870 ha dato prova di essere una scheda di grande valore, la Radeon HD 4870 X2 è stata pensata per combattere ai livelli più estremi, mentre le Radeon HD 4600 e 4500 si occupavano di offrirsi come alternativa alle schede Nvidia nelle fasce mainstream, precedentemente occupate dalle schede della serie HD 3800.

Questo approccio, ovviamente, sembra efficace contro la strategia “senza nome” Nvidia. Come sappiamo, il GT200 è composto da 1,4 miliardi di transistor, occupa un’area di 576 millimetri quadrati ed è prodotto a 65 nm. Nvidia non sembrava particolarmente incline a parlare delle dimensioni del sua revisione a 55 nm, il GT200b (490 mm quadrati). Anche a 40 nm, il chip di futura generazione dell’azienda dovrebbe essere più grande dell’attuale prodotto di punta a 55 nm.

radeon-hd-5870,1-5-224249-13.jpg

Nome in codice Cypress, il primo (e più complesso) chip Evergreen si posiziona nella fascia di prezzo dei 300-400 dollari. ATI ha pianificato l’uso di un paio di GPU nel design Hemlock, più avanti durante l’anno. Abbiamo sentito di possibili problemi di alimentazione, che costringerebbero l’abbassamento dei clock della soluzione Hemlock, ma ATI ha già detto che penserà a tutto, dagli elementi necessari per la costruzione della scheda al BIOS. Nel quarto trimestre apparirà anche Juniper, che occuperà la fascia di prezzo sotto i 199 dollari, mentre Redwood e Cedar seguiranno l’anno prossimo, e porteranno sul mercato schede con supporto DirectX 11 a meno di 100 dollari.

ATI ha testato le capacità produttive di TSMC nell’aprile scorso, con la Radeon HD 4770. A quell’epoca, avevamo abbinato due schede in configurazione CrossFire, rilevando un livello di prestazioni imbattibile per il loro costo. Sfortunatamente, l’azienda creò tanta delusione, perché non fu in grado di immettere sul mercato un numero sufficiente di prodotti per soddisfare la domanda. Il problema? Secondo quanto riportato, la resa produttiva dell’impianto TSMC era bassa.

A cinque mesi di distanza, questi problemi dovrebbero essere ormai risolti, poiché TSMC è il nodo produttivo principale di Cypress. Questa è sicuramente una buona notizia, considerando che la fotolitografia a 40 nm è una virtuale necessità, e l’alto numero di transistor, pari a 2,15 miliardi. Ugualmente impressionante è la complessità di Cypress, tutto impacchettato in una dimensione di 334 millimetri quadrati. Anche se è leggermente più grande dell’RV770 (263 millimetri quadrati), il nuovo chip di ATI è sempre più piccolo del GT200b a 55 nm di Nvidia. Con questo prodotto ATI dispone della GPU più complessa al mondo, costituita da 2,1 miliardi di transistor, e più piccola di quella del suo principale concorrente, che conta 1,4 miliardi di transistor.

 

V770 ha 10 core SIMD, Cypress ne ha 20. Come in precedenza, ogni core contiene 16 stream processor. Ogni stream processor ha cinque ALU, che ATI chiama “stream core”. Moltiplicate questi numeri e otterrete 1600 core, o shader. Aggiungiamo all’equazione la frequenza di 850 MHz, e otteniamo la capacità computazionale di 2,7 TFLOPS.

Con texture procedurali il vantaggio nella potenza grezza si riflette quasi totalmente nella pratica: la 5870 è 2,24 volte più rapida di una 4870. Non c’è dubbio che i 1600 stream processors sono presenti e si sono fatti valere!

Nella descrizione dell’architettura AMD ha lasciato una linea ambigua che afferma semplicemente “dual rasterizer”. Come probabilmente sapete, le attuali GPU sono capaci di rasterizzare un singolo triangolo per ciclo, e questa è la ragione principale per le limitazioni delle prestazioni che sono apparse nei test geometrici sintetici su architetture a shader unificati.

All’inizio, osservando la nuova architettura, abbiamo pensato che AMD avesse trovato un modo per parallelizzare il setup, il che sarebbe stato particolarmente importante per una GPU che pone molta attenzione sulla tessellation, una tecnica che genera un grande numero di triangoli. Ci sono un certo numero di opzioni per rasterizzare diversi triangoli in parallelo, ma sono molto complesse su una GPU di tipo Sort-Last Fragment – ci sono diversi problemi con la sincronizzazione, con implicazioni di vario tipo. Quindi eravamo curiosi di vedere come AMD aveva risolto questo enigma. Sfortunatamente la risposta è stata deludente: AMD aveva giocato a tira e molla con le parole. In pratica c‘è ancora solamente un singolo rasterizer, che amministra un singolo triangolo per ciclo. Tuttavia ora ci sono il doppio di unità di scan conversion, che generano pixel alla velocità di 32 pixel per ciclo in modo da pareggiare l’incremento nel numero delle ROPs. Quindi anziché un dual rasterizer, sarebbe semplicemente meglio chiamarlo “rasterizer molto più potente”.

C’è anche un nuovo elemento di cui parlare: le unità fisse che amministrano i calcoli di interpolazioni sono scomparse e il lavoro è amministrato dalle unità di calcolo shader. AMD afferma che l’impatto sulle prestazioni è quasi trascurabile ed è vero che questo è in linea con la tendenza attuale di sbarazzarsi del maggior numero di unità fisse possibili, sfruttando l’enorme potenza di elaborazione delle GPU moderne

Fonte : http://www.tomshw.it


Radeon HD 5870ultima modifica: 2009-10-18T23:30:05+02:00da troystore
Reposta per primo quest’articolo

Lascia un commento