GDDR6X Tekniska förbättringar förklarade

Den 1 septemberst, 2020 Nvidia tillkännagav sin helt nya RTX 3000-serie grafikkort som lovade enastående prestandanivåer inte bara i traditionell rasteriserad rendering utan även i raytracing. RTX 3000-kortserien skulle fortsätta bli några av de snabbaste korten på marknaden som konkurrerar med AMDs bästa erbjudanden i RX 6000-serien. Ampere-baserad GPU som var inne i dessa kort var mycket snabb på egen hand, men den mycket överlägsna prestandan var faktiskt också ett resultat av en annan förbättring.



GDDR6X lovar att ge oöverträffade nivåer av bandbredd och hastighet - Bild: Micron Technology

En stor del av den föreställningen kom från minnet ombord på dessa kort. De två översta korten i RTX 3000-serien, RTX 3080 och RTX 3090, hade en helt ny minnestyp som inte tidigare hade använts i grafikkort av spelkvalitet, så kallad GDDR6X. Denna nya typ av minne lovade dubbla bandbredden jämfört med standard GDDR6 som hittades på RTX 2000-serien och AMD RX 6000-seriens kort. Låt oss se vad som gör GDDR6X så speciell.



Vad gör VRAM exakt?

Det mesta av 'tunga lyft' när det gäller grafisk bearbetning görs av grafikkortets kärna som kallas GPU. GPU: n är en mycket kraftfull kiselbit som är designad och optimerad för att bearbeta grafiska uppgifter som spel. Den hanterar det mesta av den bearbetning som krävs för att trycka på ramarna som din bildskärm visar. Men för att kunna bearbeta stora mängder data och förbereda ramarna tillräckligt snabbt behöver GPU något att arbeta med. Det är här VRAM kommer in.



VRAM eller videominne är ett mycket snabbt minnesformat som lagras på själva grafikkortet så att GPU: n har direkt tillgång till det. VRAM lagrar tillgångar och texturer som krävs av spelet så att GPU kan arbeta med dem när det behövs och förbereda ramarna som måste visas. Om VRAM inte kan leverera dessa tillgångar och andra viktiga data till GPU: n tillräckligt snabbt kan användaren uppleva avmattningar, stammar eller till och med kraschar. I allmänhet kräver högre upplösningar som 1440p och 4K med höga grafiska inställningar mer VRAM för att hantera och lagra dessa tillgångar av högre kvalitet, vilket innebär att du behöver en högre VRAM-kapacitet om du vill spela med dessa inställningar vid dessa upplösningar. Samtidigt behöver du minne med högre hastighet för att kunna flytta data till GPU: n från VRAM tillräckligt snabbt. Det är här minneteknologier som GDDR6X visar sig vara till hjälp.



Mekanism bakom GDDR6X

Micron Technology (företaget som tillverkar och levererar GDDR6X-minne till Nvidia och andra partners) släppte nyligen några detaljer om mekanismen bakom GDDR6X-minne. Detta ger oss en bättre uppfattning om hur denna teknik kan uppnå de extremt höga bandbreddstal.

PAM4-signalering

Till skillnad från typiska datavägar som kallas 'bussar' som flyttar data 1 bit åt gången använder GDDR6X en teknik som kallas PAM4 (Four-Level Pulse Amplitude Modulation), vilket är en metod som kan skicka 1 av 4 diskreta effektnivåer åt gången istället av 2. Detta innebär att GDDR6X kan flytta 2 bitar åt gången vilket dramatiskt ökar bandbredden. Micron har en historia av intressant innovation som denna eftersom den förde branschens första GDDR5, GDDR5X och nu GDDR6X-chips till massproduktion. Micron var den enda producenten av GDDR5X och är nu den exklusiva tillverkaren av GDDR6X. Micron hade följande att säga om utvecklingen av GDDR6X med PAM4:

'På Micron fick vi forskare att undersöka hur man använder PAM4 i minnet sedan 2006', säger Ralf Ebert, Microns chef för grafiksegmentet. ”Jag sa medvetet forskare eftersom jag skulle skilja mellan utvecklare och forskare. Det här var killarna som verkligen gjorde grunden för innovationen. De tog i princip denna PAM4-teknik och försökte ta reda på hur vi kan använda det i DRAM. Forskarna var tvungna att arbeta sida vid sida med GDDR-utvecklarna, killarna som signerade chipet, säger Ebert. 'De samarbetade också mycket nära med system- och produktingenjörerna som förstår utmaningarna ur system- och masstillverkningsperspektivet.'



Det finns dock en begränsning som kommer med denna spännande nya teknik. GDDR6 har en burstlängd på 16 byte (BL16), vilket innebär att var och en av dess två 16-bitars kanaler kan leverera 32 byte per operation. GDDR6X har en burstlängd på 8 byte (BL8), men på grund av PAM4-signalering kommer var och en av dess 16-bitars kanaler att leverera 32 byte per operation. Detta innebär att GDDR6X inte är snabbare än GDDR6 på samma klockhastigheter. Detta innebär också att eftersom GDDR6X bär dubbelt så många signaler som GDDR6 under varje cykel, är det också mycket effektivare. GDDR6X är 15% mer energieffektiv än GDDR6 (7,25 pj / bit vs 7,5 pj / bit) på enhetsnivå, enligt Micron.

PAM4-signalering är en revolutionerande teknik inom minneteknik - Bild: Micron Technology

Stäng samarbetet med Nvidia

En stor drivkraft bakom pressen för högre bandbredd och högre hastigheter har varit Nvidia själv, som har samarbetat nära med Micron under utvecklings- och testfaserna i GDDR6X-minnet. Nvidia är den enda lanseringspartnern för Micron när det gäller GDDR6X-minne, vilket innebär att den nya minnestypen kommer att vara exklusiv för Nvidia-kort under en längre tid. Nvidia har redan installerat det nya minnet på deras flaggskepp GeForce-grafikkort; RTX 3090 och RTX 3080, som därmed har blivit enorma språng i bandbredd över senaste generationen GDDR6.

De kompletta specifikationerna för GDDR6X-minnet - Bild: Micron Technology

Nvidia har också designat en helt ny minneskontroll och PHY för GDDR6X eftersom den använder PAM4-signalering, och genom utseendet på det har allt designats internt av Nvidia själv. GDDR6X-tekniken borde också komma till fler kort från Nvidia, särskilt TITAN- och Quadro-serierna som skulle kunna dra mycket nytta av den ökade bandbredden för GDDR6X i kombination med högre kapacitet. Micron har också bekräftat att Nvidia inte är en exklusiv partner för GDDR6X och att fler företag också skulle få den nya minnesstandarden senare. Det betyder att vi kan förvänta oss att AMDs Radeon-kort också har någon form av GDDR6X-applikation när fler av dessa kort startar i framtiden.

GDDR6X med PAM4 vs HBM2

Även om GDDR6X med sin nya PAM4-teknik fortfarande är dyrare att tillverka än GDDR6, är det inte ens nära kostnaden för HBM2-tillverkning. HBM eller High Bandwidth Memory verkade verkligen som framtiden för grafikkortminne för några generationer sedan. AMD pressade väldigt hårt för att få HBM till mainstream-marknaden och de lanserade en serie riktigt överväldigande GPU: er med HBM ombord. Fury och Vega-serien av grafikkort använde High Bandwidth Memory, men tyvärr var deras GPU-kärnor inte tillräckligt snabba för att ge dem någon form av fördel över Nvidia.

Det flashiga HBM2-minnet återfördes återigen i Radeon VII, AMD: s nya avancerade grafikkort baserat på Vega-arkitekturen men nu byggt på 7nm-processen. HBM2 inuti Vega-korten var extremt dyrt att tillverka och hade låga avkastningar, vilket ledde till lågt utbud och ännu lägre efterfrågan. Radeon VII kunde inte komma nära Nvidias flaggskepp, RTX 2080Ti, och mötte EOL inom ett år efter lanseringen. Det mycket snabbare Nvidia-flaggskeppet använder standard GDDR6.

AMD själv flyttade sig bort från sina HBM-ansträngningar efter en förändring i företagets hierarki och flera högtstående medlemmar befriades från sina uppgifter. Den nya AMD Radeon flyttade snabbt bort från HBM-minnesobsessionen och till mycket mer realistiska minnesval som GDDR6-minnet som finns i RX 5000 och RX 6000-serien av GPU: er . Det största problemet med HBM2 är tillverkningen. Processen är extremt tråkig och dyr eftersom HBM2 KGSDs (kända bra staplade matriser) måste monteras på en halvledarfabrik och sedan placeras på en mellanlägg bredvid en GPU i ett renrum av en annan fabrik. Detta gör produktionen mycket dyrare och mödosammare än GDDR6 eller till och med GDDR6X eftersom GDDR6X inte kräver stapling och levereras som diskreta chips som kan lödas ner på en fabrik.

GDDR6X levererar branschledande bandbreddsnivåer - Bild: Micron Technology

Det finns dock en varning som måste noteras här. GDDR6X-chips behöver en mycket ren och stabil signal, vilket är anledningen till att Nvidia-minneskontrollen på GA102 GPU som driver minneskretsarna nu sitter på en separat strömskena. Detta säkerställer att chipsen får sin nödvändiga rena och stabila kraft som de behöver för att fungera korrekt.

PAM4 för framtiden

PAM4-signalering är en intressant och riktigt spännande ny process som kan hitta dess applikationer inom flera områden av PC-hårdvara. Medan det just nu är begränsat till GDDR6X-applikationen i grafikkort, kan signaleringstekniken ha många fler användningsområden i andra processer i framtiden. Micron tror att framtidens minne är PAM 4-tekniken.

'Så, GDDR6X är där vi introducerade PAM4, och vi kan definitivt se att det går framåt', säger Microns chef för grafikminne. ”Potentiellt kan PAM4 användas i andra minnestandarder. Det är möjligt eller troligt att denna typ av teknik kommer att användas av företag med processorer eller våra andra processorer. ”

En annan intressant framtida tillämpning av PAM4-signaleringsstandarden är PCIe Gen 6.0 som beräknas 2021. Den använder PAM4-signalering för att extrahera mer effektivitet och högre datahastigheter. Eftersom PCIe har ett mycket brett antagningsområde måste CPU- och ASIC-företag så småningom anta PAM4 och PCIe 6.0 någon gång i tiden. Kanske kommer det någon gång också att användas i HBM2-minne för att ge overklig bandbredd och hastighet men det är bara spekulation från vår sida.

Var används GDDRX?

Även om vi lägger framtiden åt sidan, används GDDR6X fortfarande i många viktiga applikationer idag. Några av de viktiga inkluderar:

  • Spel: Den största och mest populära användningen av GDDR6X-minne är naturligtvis inom spel. Micron har tillhandahållit GDDR6X-modulerna till Nvidia för integration i deras helt nya RTX 3080 och RTX 3090 grafikkort. Detta minne gör det möjligt för dem att uppnå oöverträffade nummer när det gäller minnesbandbredd och hastighet. Den första generationen av GDDR6X kan uppnå dataöverföringshastigheter på upp till 1 TB / s. Detta kan vara extremt fördelaktigt när det gäller nästa generations spel.
  • HPC: GDDRX-tekniken används i HPC eller High-Performance Computing. Det kännetecknas av mycket parallella beräkningar som kör avancerade applikationsprogram på ett tillförlitligt, effektivt och så snabbt som möjligt. Dessa datalösningar används av forskare, forskare, ingenjörer och akademiska institutioner för att lösa komplexa problem.
  • Professionell virtualisering: Branscher som vård och medicin, professionell efterbehandling av video, ekonomiska simuleringar, väderprognoser eller olja och gas är beroende av riktigt avancerade arbetsstationer som kan använda kraften i GDDR6X-minne för att effektivisera och optimera deras arbetsflöde. Dessa högpresterande arbetsstationer är ett viktigt användningsfall för nya GDDR6X.
  • Artificiell intelligens: GDDRX-minneteknik används i artificiell intelligens och dess derivat som Deep Learning. Dessa arbetsbelastningar blir allt viktigare liksom vanliga, och höghastighetsdatorlösningar som GDDRX kan definitivt hjälpa till i detta avseende.

GDDR6X hittar sina applikationer i många fler delar av branschen - Image; Micron Technology

Slutord

GDDR6X är en ny typ av minne som har utvecklats av Micron i nära samarbete med Nvidia. Minnet använder en ny teknik som kallas PAM4-signalering, vilket är en mycket innovativ arkitektonisk process där den effektiva dataöverföringshastigheten fördubblas. Signaleringstekniken sänker också energianvändningen och gör därmed minnet mer effektivt.

Nvidia har implementerat minnet i sina nya RTX 3080- och RTX 3090-kort, och detta är bara början på GDDR6X-minnets slutliga lansering på spelmarknaden. Minnet är lättare och billigare att tillverka än HBM2 och ger oerhört lovande resultat, så det verkar som att hela branschen kommer att anta denna standard förr eller senare. Just nu finns GDDRX-teknologierna i många sektorer inklusive spel, HPC, professionell virtualisering och AI.