Site-uri

Nvidia dezvaluie noua generatie Fermi Architecture

Nvidia A100 - тест первого GPU AMPERE, Ryzen 4000 совместим не со всеми платами, intel не тянет 10nm

Nvidia A100 - тест первого GPU AMPERE, Ryzen 4000 совместим не со всеми платами, intel не тянет 10nm
Anonim

Gigantul chip a fost foarte atent pentru a poziționa cip ca nu un cip grafic noi, "

calculează și grafica" chip, în acea ordine (italics mine). De fapt, aproape tot ce a dezvăluit despre noul chip se referă la caracteristicile sale computationale, mai degrabă decât la elemente tradiționale orientate spre grafică, cum ar fi unitățile de textură și capetele de redare. Ceea ce știm este că cipul este uriaș la o valoare estimată de 3,0 miliarde de tranzistori și va fi produs pe un proces de 40nm la TSMC. Este vorba despre circa 40% mai multe tranzistori decât cipul RV870 din noile carduri DirectX 11 din seria Radeon 5800, lansate de rivalul AMD. Cipul are 512 unități de procesare (Nvidia le numește nuclee CUDA) organizate în 16 "multiprocesoare streaming" de câte 32 de nuclee fiecare. Acest lucru este mai mult decât dublul celor 240 de miezuri din GT200, iar nucleele au în plus îmbunătățiri semnificative. Cipul va utiliza o interfață de memorie GDDR5 pe 384 de biți. Iată câteva dintre punctele principale:

Procesor multiprocesor (SM) de generația a treia

32 miezuri CUDA pe SM, 4x peste GT200

  • performanța punctului de vârf dublu de precizie peste GT200
  • Planificatorul Dual Warp care programează și expediază două deformări de 32 de fire
  • pe ceas
  • 64 KB de memorie RAM cu o partiționare partajată a memoriei partajate și a cache-ului L1
  • Generarea de paralel execuție a fișierelor ISA

Spațiu de adresă unificat cu suport complet C ++

  • Optimizat pentru OpenCL și DirectCompute
  • IEEE 754-2008 de precizie pe 32 de biți și 64 de biți
  • Extensii
  • Instrucțiuni de acces la memorie pentru a sprijini tranziția la adresarea pe 64 de biți
  • Performanță îmbunătățită prin predicție
  • Subsistem îmbunătățit de memorie

NVIDIA ierarhie paralelă de date cu configurabil L1 și unified L2

  • Primul GPU cu suport pentru memoria ECC
  • Funcție de memorie atomică îmbunătățită foarte mult performanță
  • NVIDIA GigaThread Engine
  • 10x mai rapidă schimbare a contextului de aplicație

Executarea kernelului concurent

  • Executarea blocului thread
  • Motoarele de transfer de memorie dublu suprapuse
  • performanța acestui cip în sarcinile de calcul al fluxului, precum viteza de calcul cu rată variabilă mai rapidă cu dublă precizie. GPU-urile actuale Nvidia calculează precizia dublă la fracțiunea de viteză a operațiilor cu o singură precizie. Operațiunile cu operațiuni cu virgulă mobilă cu dublă precizie ar trebui să fie acum la jumătate din performanța de precizie unică, ceea ce reprezintă o îmbunătățire imensă. Se remarcă și îmbunătățiri importante în cache și programare. Puteți citi mai multe despre arhitectura de pe noua pagină Fermi a Nvidia, care include o imagine PDF albă.
  • Deci, când veți putea cumpăra o placă grafică care utilizează acest cip? Nvidia nu spune. Reprezentantii companiei au spus ca in prezent "cresc chipul", ceea ce inseamna ca mostrele de lucru s-au intors recent de la uzina de fabricatie. Făcând o estimare educată din istoria trecută, am spune că decembrie este o dată de lansare optimistă, iar Q1 2010 pentru o disponibilitate largă este mult mai probabil. Asteptati ca placile sa fie scumpe. Nvidia nu va divulga mărimea cipului, dar judecând după numărătoarea tranzistorului, ne-am ghici între 450 și 500 mm

2

. Cuplat cu costurile adăugate la bordul unei interfețe de memorie de 384 de biți și provocările cu obținerea unor randamente bune dintr-un cip așa de mare pe procesul de fabricare relativ nou de 40nm și căutați cărți care ar putea fi atât mai puternice, mai scump decât cardurile din seria Radeon 5800 din seria AMD. Urmăriți Jason Cross pe Twitter sau vizitați blogul său.