Vyberte stránku

Na testovacej stolici sme testovali Bulldozer: FX-8150 a tri základné dosky 990FX

Na testovacej stolici sme testovali Bulldozer: FX-8150 a tri základné dosky 990FX

Technológie

Čipy sa vyrábajú na uzle SHF spoločnosti GlobalFoundries s veľkosťou 32 nm. Pre buldozéry bol predtým predstavený SOI kombinovaný s procesorom Intel HKMG (High-K Metal Gate), ktorý môže pomôcť v boji proti unikajúcemu prúdu. Architektúra je navrhnutá tak, aby dosahovala vysoké frekvencie hodín („Speed ​​racer“), vďaka čomu je pravdepodobné, že modelová rada bude úplne zbavená produktov s frekvenciou nižšou ako 3 GHz. Všetky centrálne jednotky v starom jazyku sú Black Edition, preto teraz nie sú konkrétne označené.

V tomto okamihu urobme malú odbočku a pozrime sa aj na druhú stranu mince. Najrýchlejší štvorjadrový procesor Phenom II tiká na 3,7 GHz a šesťjadrový čip Thuban na báze čipu 1100T tiká na 3,3 GHz. V porovnaní s tým je základná strela 32nm procesora AMD FX-8150 takmer neuspokojivo nízka a prijateľná je iba „úroveň“ 4,2 GHz Turbo Core, ktorá okamžite sľubuje 10-15% prebytok energie (nie). XbitLabs pred rokom ventiloval, že Bulldozer prekračuje takt 3,5 GHz, ktorý sa síce spojil, ale napriek sérii lapsov. Zdá sa byť správne predpokladať, že stále existujú vážne problémy s výrobou a výstupom nového kanónu, čo má výrazný vplyv na výkon.

amd_bulldozer_šesťrýchlostný
Druhé celé číslo iba zväčší veľkosť modulu o 12 percent. [+]

Na základe dlhoročných skúseností sa zrodil dokonca aj základný koncept, ktorý bol založený na nasledujúcom: centrálne jednotky vykonávajú operácie s pevnými bodmi v priemernom tempe nad 80 percent. Z toho je zrejmé, že výpočty s pohyblivou rádovou čiarkou sú v životoch „stonožiek“ oveľa menej. V návrhu sú teda následne spojené dve celočíselné jadrá, ktoré majú svoju vlastnú medzipamäť prvej úrovne, ale už musia zdieľať medzipamäť druhej úrovne a jednotku s pohyblivou rádovou čiarkou. AMD jednotku pomenovalo ako modul.

amd_bulldozer_one_module
Jeden modul [+]

Podľa interných meraní druhé celé číslo v zásade zväčšuje veľkosť modulu v zanedbateľnej miere, na rozdiel od toho môže ideálne spôsobiť zvýšenie výkonu až o 80%. Časť primárnej vyrovnávacej pamäte zodpovedná za dáta je priamo spojená s procesormi (veľkosť 16 Kbyte, oneskorenie 4 hodiny), ale 64 Kbyte cache určená na ukladanie pokynov je už zdieľaná medzi integrálmi.

1_module_what_which
Kopať hlbšie [+]

Na základe výsledkov testu je dátová vyrovnávacia pamäť L1 nielen príliš malá, ale dokonca pomalá, čo spolu nie je veľmi dobrá kombinácia. Veľkosť úložiska druhej úrovne zdieľaného v rámci modulu je uspokojivá, ale jeho latencia je vysoká, 25 - 27 cyklov. Je ľahké si predstaviť, že väčšia vyrovnávacia pamäť L1 a rýchlejšia L2 (12-15 cyklov) by zlepšili výkon procesora o 10-20%.

Nie je prekvapením, že dosiahnutie 8 MB L3 nie je ani pri rýchlosti svetla (65 cyklov). Stručne povedané, systém vyrovnávacej pamäte Bulldozer nebude ôsmym zázrakom sveta.

inštrukcie
V bludisku s pokynmi [+]

Bulldozer má momentálne najširšiu sadu podpory inštrukcií: MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1, SSE4.2, AVX, AES, FMA4, XOP, PCLMULQDQ a samozrejme 64-bitové rozšírenie. Z týchto dvoch noviniek (FMA4, XOP) má FMA4 na trhu HPC veľký význam a XOP ponúka malú výhodu v multimediálnych aplikáciách. Pokiaľ vieme, najnovšia verzia x264 už podporuje nové inštrukčné sady. Zastarané 3DNow! podpora bola prerušená, myslím si, že to mnohým čitateľom nespôsobuje prebdené noci.

Je známe, že svoj procesor Intel VT používate na prístup k virtuálnej pamäti x86. IOMMU významne zvyšuje výkon virtualizácie systému, avšak prekvapivé je, že špičkové riešenia spoločnosti Intel (Core i5-2600K, i7-2600K) túto technológiu nepodporujú a tento „čierny kruh“ zahŕňa súčasné riešenia Sandy Bridge E. Opäť ide o extra službu v porovnaní s priamou konkurenciou, aj keď jej užitočnosť pre priemerného používateľa je otázna.

40
Teoreticky Turbo Core [+]

Vylepšené bolo aj Turbo Core, ktoré pracuje s viac hodinovými bránami a ešte lepšie sa prispôsobuje rôznym úrovniam využitia. Ak sú všetky jadrá aktívne, ale jednotky s pohyblivou rádovou čiarkou sa momentálne nepoužívajú, prejavia sa hodiny Turbo Core 2.0. Postup dynamicky mení hodinové signály jadier v závislosti od záťaže, neaktívne zdroje, moduly a komponenty vo vnútri modulu je možné vypnúť, takže v tejto oblasti by ste nerozumeli sťažnosti smerujúcej k prednej časti domu. Softvérová stránka veci vás, bohužiaľ, dôkladne hodí do polievky.

v praxi
Praktická implementácia [+]

Plánovač Windows 7 nie je, mierne povedané, najefektívnejší spôsob prideľovania úloh, pretože často strieda rozdelenie úloh medzi jadrá. Ďalšia verzia operačného systému problém vyrieši a čoskoro bude vykonaná oprava tohto systému, takže - v extrémnych prípadoch to môže byť 15 - 25 percent - čoskoro dosiahneme o 2 - 10% vyšší výkon. Ďalšou veľmi príjemnou výhodou bude, že spotreba voľnobehu sa dá znížiť o 4 až 5 wattov, pretože moduly môžu zostať dlhšie „v prevádzke“.

buldozerwin8_and_bf3
"Neber si zuby ako darček" [+]

buldozerbf3betafx

"Transformácia" počas Battlefield 3 [+]

Battlefield 3 tiež dobre ukazuje, ako veľmi nejaká optimalizácia pomáha procesoru. V tejto hre môže momentálne najvýkonnejší procesor série FX dosiahnuť výkon Core i7-2600k.

Procesory radu FX sa dodávajú s krytom Socket AM3 + a sú umiestnené v základných doskách AMD s čipsetom série 9. Orientáciu uľahčuje aj farba objímky, ktorá je väčšinou čierna. Na dodanie nekonečne zvukovej platformy Scorpius potrebujeme procesor série FX, základnú dosku s čipsetom série 9 a grafickú kartu série Radeon HD 6000. Bulldozer má dvojkanálový radič pamäte DDR1866, ktorý podporuje moduly 3 MHz.

phenomu_folulk

AMD FX-8150 s procesorom Phenom II X4 970 BE - zhora [+]

Na záver by sme chceli pridať ďalší zaujímavý prírastok. Vážne polemiky vyvolali skutočnosť, že počet hodín vykonaných za hodinu (pokyny za cyklus) procesormi založenými na buldozéroch sa v porovnaní s predchodcom v priemere o niečo znížil. Niektorí si okamžite predstavia pád architektúry, iní uvádzajú podobné príklady z minulosti. V tejto súvislosti sa ako vždy obmedzme na fakty. Programátori si dnes čoraz viac uvedomujú výhody viacjadrovej optimalizácie. Pri 8-valcovom motore, ktorý v zásade poskytuje dobrý výkon, zriedka premýšľame o tom, čo dokáže s 1 valcom.

phenomualulk

AMD FX-8150 s procesorom Phenom II X4 970 BE - spodná časť [+]

Príklad nie je najlepší, ale môže vniesť svetlo do bodu. Netvrdíme, že budeme optimálne využívať osem celých jadier husto, ale Turbo Core 2.0 sa v tomto prípade zameriava na najvyšší možný takt (4,2 GHz). To, čo je tu k dispozícii iba v prípade K10.5 za cenu „krvavého potu“, sa tu považuje za „základné hodiny“. Tiež nie je pochýb o tom, že implementácia AVX, FMA a XOP stála významnú sadu tranzistorov. Základy architektúry sa používajú vo viacerých segmentoch (server, stolný počítač), takže sa to javilo ako povinný krok, ale dnes vidíme ešte menej jeho výhod (najmä v stolnom prostredí).

socket_2k

Ležať v posteli [+]

V ideálnom prípade (FMA4 + AVX) sa buldozér cíti skutočne veľmi elementárne, podáva prekvapivý výkon a hneď dáva veci do iného svetla. Podľa meraní nemeckého HT4U, počas vykresľovacej aplikácie C-Ray 1.1, AMD FX-8150 pracuje za rovnakých 15 sekúnd ako Intel Core i7 990X. To je presne polovica času, ktorý tejto práci trval procesor AMD Phenom II X6 1100T. V zátvorke by sme poznamenali, že sme zvážili aj druhý extrém, Super PI.