Vyberte stránku

Vyskúšali sme to: AMD GCN - predstavujeme Radeon HD 7970 a HD 7950

Nastal čas, aby sme konečne predstavili architektúru AMD GCN (Graphics Core Next) a jej dvoch najvýkonnejších predstaviteľov, Radeon HD 7970 a Radeon HD 7950.

Logá článkov GCN

Z HD 7950 sme hneď vzdali hold dvom z nich, takže sme mali možnosť otestovať aj CrossFireX a obe karty sme vykonali aj vyladené merania. Samozrejme sme proti dvom novým kanónom vyslali aj niekoľko jazdcov, aby sme zistili, ako veľmi sa karty zrýchlili v porovnaní s predchádzajúcou generáciou GeForces a Radeons. 


Predtým, ako sa dostaneme k účastníkom a testom, sa bližšie pozrieme na architektúru GCN a prevezmeme funkcie HD 7970 a HD 7950.

 allcardsboxes 2k

 Ďalej grafické jadro

V máji 2007 spoločnosť AMD predstavila grafickú kartu Radeon HD 2900 XT, ktorá už bola postavená na jednotnej architektúre shaderov. Ako sa ukázalo, dizajn mal niekoľko nedostatkov, ale problémy boli takmer úplne eliminované dobou série Radeon HD 4000, čo spoločnosti poskytlo miesto na trhu s grafickými kartami pre stolné počítače. V tomto okamihu je zrejmé, že teraz sú potrebné radikálne zmeny. Séria HD 6900 „Cayman“ sa považuje za prvý krok. Tu boli predchádzajúce 5-smerné superskalárne procesory (VLIW5) nahradené 4-smerovými procesormi (VLIW4) a Cayman bol prvým čipom, ktorý spracovával viac nezávislých tokov inštrukcií. Druhou veľkou inováciou bolo zavedenie dvoch „grafických strojov“, ktoré zdvojnásobili kapacitu nastavenia trojuholníka - zvýšili tak mozaikový výkon - a počet niektorých prvkov (Rasterizer, Hierarchical Z, Tessellator). Dnes sa stal predmetom nášho testu ďalšej úrovne. Vďaka architektúre zvanej Graphics Core Next (GCN) sa shaderové polia, ktoré pracujú s doteraz používanými inštrukciami VLIW, zastarali a nahradili ich takzvané výpočtové jednotky (CU). Spoločnosť GCN debutovala v rodine Radeon HD 7900 „Tahiti“.

19 m

Je zaujímavé, že neprekvapuje, že Tahiti GPU dosiahli vynikajúcu hustotu tranzistorov vďaka 28nm technológii výroby šírky pásma TSMC - obsahujú 365 miliardy tranzistorov na 4,3 štvorcových milimetrov. Jedna výpočtová jednotka obsahuje štyri SIMD a jednu skalárnu jednotku. Vlajková loď AMD Radeon HD 7970 „Tahiti XT“ pracuje s 32 aktívnymi CU, za predpokladu celkového počtu 2048 16 shaderových procesorov (štyri 64-smerové SIMD, XNUMX ALU). Vzhľadom na doterajší pokrok generácií sa to na prvý pohľad nezdá byť vynikajúcou hodnotou, ale kvôli lepšej efektívnosti a využitiu by sme chceli konštatovať, že nestojí za to, aby sme z tohto omylom vyvodzovali ďalekosiahle závery technický ukazovateľ. Teoreticky môže CU pracovať rovnako ako jedna jednotka Cayman SIMD. Hlavným problémom predchádzajúcich generácií je závislosť od údajov (následné pokyny závisia od seba navzájom od údajov), ktorá spôsobila prudké kolísanie využívania. Architektúra GCN je tiež krokom vpred v tejto oblasti, pretože eliminuje predtým zažité závislosti prostredníctvom spracovania toku. Výhody sú iba v nadpisoch: plánovanie, ladenie, odhad očakávaného výkonu a vývoj ovládačov sa tiež radikálne zjednodušili a sprehľadnili. 

24

36 mCU nielenže obsahuje štyri SIMD jednotky, ale má aj svoj vlastný plánovač, 340 KB dočasného úložiska a textúrovací klaster. Vyplýva to zo súčtu vektorového registra 4 × 64 KB, Local Data Share, ktorý má tiež veľkosť 64 KB, skalárneho registra 4 KB a vyrovnávacej pamäte prvej úrovne s kapacitou 16 KB. Na obrázku vyššie môžete vidieť ešte jeden komponent, ktorý si určite zaslúži zmienku, a tým je takzvaná „Branch & Message Unit“, ktorá zohráva úlohu pri efektívnejšom ovládaní programov.
Po získaní týchto informácií si znova prečítajme kľúčové parametre grafického procesora „Tahiti XT“: 32 CU (shaderový procesor 2048, 128 SIMD), 128 texturovacích jednotiek, 512 jednotiek Load-Store a celkovo 8,2 MB cache. Pozícia dievčaťa bola teda hneď iná, aj keď sme sa ešte len začínali „vyzliekať“.

35 mčelné

Pokiaľ ide o frontend, môžeme vidieť výrazné rozdiely v porovnaní s architektúrou NVIDIA GF110. Správa sa v zásade nerobí na úrovni UK. Túto úlohu vykonáva príkazový procesor a asynchrónny výpočtový stroj (ACE). Čip dostal dva geometrické motory, ktoré okrem Geometry-Assembler, Vertex-Assembler, obsahujú aj jednotky tessellatoru deviatej generácie. Komunikáciu s CU uľahčuje globálne zdieľanie údajov (GDS), prostredníctvom ktorého môžu tieto jednotky tiež navzájom zdieľať údaje. Frontendová časť obsahuje dva rasterizátory - rozloženie vidíte nižšie.

37

ROP a pamäťové rozhranie
AMD Tahiti obsahuje 8 klastrov ROP - v tomto okamihu sme našli zhodu s čipom Cayman. Každé také „pole“ obsahuje štyri jednotky ROP a 16 vzorkovačov Z. Je dôležité spomenúť, že každý klaster dostal svoju vlastnú cache. Došlo k ďalšej významnej zmene: už neexistuje priame spojenie s pamäťovým radičom. Tento krok je zameraný na zlepšenie flexibility a použiteľnosti, čo môžeme vidieť v súvislosti s Pitcairnom ... ROP môžu zapisovať do vyrovnávacej pamäte L768 s veľkosťou 2 KB, ktorú zase môžu čítať viaceré jednotky. Rozhranie pamäte prijíma radostný obraz. Šesť 64-bitových radičov pamäte má celkovú kapacitu 384 bitov. K tomu by sme len pridali slovo. Konečne! Predvolená veľkosť videopamäte je 3072 MB, ale teoreticky sú možné aj 1536 MB a 6 GB.

Dúfame, že to naši čitatelia neberú v zlom mene, ale v tejto chvíli by sme vyjadrili naše osobné názory na oblasť back-endu. Vzťah medzi Barts, ktorý si počínal naozaj dobre, a čipom Cayman, ktorý vykazuje relatívne skromné ​​výsledky, naznačuje, že „všeobecným problémom“ čipov AMD je obmedzená kapacita ROP. Ani na Tahiti tu nedošlo k žiadnemu pokroku, zatiaľ čo o ďalších novinkách čipu by sa s určitými zveličeniami dalo ešte písať stránky. Úloha ROP je obzvlášť prominentná počas hier, pri úlohách a aplikáciách GPGPU sa stávajú rolami druhých huslí. Je tiež isté, že táto sekcia spotrebuje veľké množstvo tranzistorov, čo sa samozrejme prejaví aj na veľkosti čipu.

 

Vylepšenia AMD doteraz do veľkej miery slúžili potrebám hráčov. Teraz došlo k otočeniu najmenej o 90 stupňov a stala sa vysoko zameranou na uspokojenie profesionálnych potrieb, na širšie využitie GPU. Samozrejme to nie je problém, keďže v podstate hovoríme o veľmi hrubej úrovni výkonu, ktorá určite vydrží skúšky moderných hier aj niekoľko rokov. Podľa povestí nielen AMD, ale aj NVIDIA zaobchádza s ROP úzko s Keplerom.

Rozšírenie pamäťovej zbernice bol chvályhodný krok. V skutočnosti nemali návrhári na výber. Hodiny sa už nedajú výrazne zvýšiť, ale čip po údajoch hladuje. Samotný tento krok podľa nás mohol zvýšiť výkon pri hrách až o 15 percent.

44DirectX 11.1 a PCI Express 3.0
Štandard PCI-Express 3.0 zvyšuje rýchlosť zo 16 GB / s na 32 GB / s, čím sa zdvojnásobuje rýchlosť dátového prenosu PCIe 2.0. Výrobcovia základných dosiek sa tejto témy okamžite „zahryzli“, ale bez ohľadu na to, koľko chcú, prepínač v súčasnosti neponúka významnú výhodu. PCIe 3.0 je dôležitá zbraň z marketingového hľadiska, povinný štandard pre AMD a NVIDIA a ďalšia „pasca peňazí“ pre používateľov.
DirectX 11.1 môže začať dobývať nasledujúci operačný systém Windows, ktorý obsahuje drobné opravy a optimalizácie. Podľa oficiálneho materiálu môžeme od nového API čakať natívnu stereo 3D podporu a efektívnejšiu rasterizáciu. Bohužiaľ, azda najzaujímavejší bod, ktorý pojednáva o tom, ako možno zlepšiť flexibilitu a rozsiahlu použiteľnosť grafického hardvéru, nebol podrobne opísaný.

31 m

Architektúra Graphics-Core-Next vyzerá zhruba takto. Čip samozrejme slúži nielen potrebám hráčov, ale má priestor aj pre profesionálne úlohy. Špičkový teoretický výkon výpočtu Tahiti (pre výpočty s dvojitou presnosťou) je 947 GFLOP, štyrikrát vyšší pre operácie s pohyblivou rádovou čiarkou s jednou presnosťou. Okrem toho majú pamäte podporu ECC a GPU je dobre oboznámený s API DirectCompute 11.1, OpenCL 1.2 C ++ AMP.27 Nové funkcie: Zero-Core
Všeobecne platí, že najvyšší predátori na úrovni Radeon HD 7900 sú zvyknutí konzumovať tabuizovanú tému, inžinierom AMD však chýba vynaliezavosť. Myšlienka je jednoduchá, ale skvelá, ale nie nová. Ak necháte počítač dlhší čas osamotený, ale z nejakého dôvodu ho nechcete vypnúť, bude vhodné ponechať monitor iba v pohotovostnom režime. Vďaka technológii ZeroCore Power môže byť pri vypnutom displeji vypnutý celý grafický radič a v tejto podobe nie je potrebné aktívne chladenie. Výhody sú presvedčivé: nulový hluk, spotreba energie 3 watty. Pre mnohých to bude nepodstatný faktor, ale postup pri štvorcestných systémoch Crossfire vypne iné ako primárne grafické karty, čo výrazne zníži váš účet za elektrinu - hoci ktokoľvek, kto premýšľa o takomto zoskupení, bude mať s energetickou účinnosťou málo spoločného.

21

20

Očnosť 2.0
Jednou zo zaujímavých vlastností novej verzie je, že vám umožňuje viesť konferenčné konverzácie s viacerými monitormi s viacpásmovým zvukom. Oficiálny názov postupu je Discrete Digital Multi-Point (DDM) Audio. Kartu Radeon HD 7970 je možné pripojiť súčasne k trom displejom, ktoré môžu prijímať osemkanálové zvukové toky. To nemusí zvlášť zaujímať domácich používateľov, ale je to dobrý príklad toho, v koľkých oblastiach sa dá nové delo použiť. Vyvíja sa aj jednotka Catalyst, ktorá uľahčuje napríklad umiestnenie zásobníka a umožňuje zostavovať vlastné rozlíšenia. Za zmienku stojí, že Full 3D stereofónny XNUMXD obsah je možné sledovať aj v režime Eyefinity. 

29 m

UVD a VCE
UVD 3.0 už ponúka hardvérovú akceleráciu pre obsah DivX / Xvid, MPEG-4 časť 2 MVC a Video Code Engine (VCE) je vlastne ekvivalentom AMD pre Intel Quick Sync Video. VCE je samostatný hardvér a je navrhnutý iba na urýchlenie prekódovania videí H.264. Motor je pomalší ako shaderové procesory v grafickom procesore, ale oveľa energeticky efektívnejší. Užívateľom sú k dispozícii dva režimy. V prvej funguje iba VCE, ktorá je sama o sebe rýchlejšia ako väčšina CPU. V takom prípade sa spomalenia nedočkáme, môžeme bez problémov načítať grafickú kartu alebo centrálnu jednotku. Druhou možnosťou je hybridný režim. Aritmeticko-logické jednotky VCE a GPU skočia na úlohu spoločne. Toto „manželstvo“ má samozrejme dobrý vplyv na rýchlosť kódovania, ale v takom prípade sa nečudujte, keď sa vaša obľúbená hra prepne do režimu „prezentácie“.

32

Teraz, keď si uvedomujeme teóriu a čísla, sa v teste zoznámime s tromi modelmi GCN!