Hirdetés

2024. június 10., hétfő

Gyorskeresés

Hozzászólások

(#1) fatpingvin


fatpingvin
őstag

ígéretes. nagyon remélem hogy realizálódni is fog, jó lenne leszakadni végre a CUDA-ról.

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#2) Busterftw


Busterftw
veterán

(#3) fatpingvin válasza Busterftw (#2) üzenetére


fatpingvin
őstag

nem mondom hogy nem jutott eszembe a 927-es szám a cikket olvasva, mindenesetre azért valahol reménykeltő, ugyanis ez nem egy N+1-edik többivel nem kompatibilis interfész hanem egy közös platform ami pont az inkompatibilkitást hivatott áthidalni. egymenetes fordítóként ez egész ígéretes.

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#4) Busterftw válasza fatpingvin (#3) üzenetére


Busterftw
veterán

Szerintem meg egyszerubb a mar elterjedt, kvazi standard CUDA-t hasznalni es igy nincs/kevesbe van kompatibilitas problema.

(#5) fatpingvin válasza Busterftw (#4) üzenetére


fatpingvin
őstag

jó vicc, a licenszelése ezt meglehetősen problémássá teszi. meg különben is, elég rossz ötlet egy egyszeri cég által fejlesztett és a közösbe nem bedobott technológiát megtenni iparági standardnak.

ha a nvidia a teljes technológiát átrakná open licenszr, akkor azt mondanám hogy oké.

[ Szerkesztve ]

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#6) Busterftw válasza fatpingvin (#5) üzenetére


Busterftw
veterán

Az Adobe Suite is fizetos es iparagi standard.
Szerintem teljesen normalis, ha van egy piacvezeto megoldasod, azert penzt kerj.

Mas kulonben ott tartunk amirol a kep szol.

[ Szerkesztve ]

(#7) fatpingvin válasza Busterftw (#6) üzenetére


fatpingvin
őstag

nyilván ha te vagy a fejlesztő/gyártó... a piac többi részéről meg bődületes hülyeség belemenni.

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#8) Busterftw válasza fatpingvin (#7) üzenetére


Busterftw
veterán

Amm, a piac belement az Adobe Suite-ba is es ugyanez elmondhato a CUDA-rol is.
Miert lenne boduletes hulyeseg?

(#9) fatpingvin válasza Busterftw (#8) üzenetére


fatpingvin
őstag

mert monopolhelyzetbe hozott olyan cégeket amelyeknek elemi érdeke visszafogni a fejlődést.

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#10) Busterftw válasza fatpingvin (#9) üzenetére


Busterftw
veterán

Epp forditva, sajat megoldasaikkal ok valtak ipari standarda.
Lassuk az AMD peldajat:
In 2021, AMD released its open-source GPUFORT as a competitor to NVIDIA's CUDA.
Tehat most legyen a 2 eve versenyzo, alig problat GPUFORT a standard, mert opensource es mert csak?
A CUDA meg mar 15 eve letezik es az Nvidia tolja bele a fejlesztest es az innovaciot.

[ Szerkesztve ]

(#11) fatpingvin válasza Busterftw (#10) üzenetére


fatpingvin
őstag

nem azt mondtam hogy számoljuk fel a CUDA-t. az OpenSYCL sem ezt célozza.

ez egyszerűen annyiról szól hogy lehessen GPGPU-ra írt kódot uniform módon fordítani ezekre a különböző architektúrákra. ahogy C kódot is lehet x86-ra meg ARM-re is fordítani (bizonyos megkötésekkel nyilván amik itt is jelen lesznek)

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#12) Busterftw válasza fatpingvin (#11) üzenetére


Busterftw
veterán

De epp errol van szo, hiszen milyen hatasfokkal lesz ez mukodokepes?
Ezert lenne egyszerubb arra fokuszalni, amit a piac hasznal.

(#13) fatpingvin válasza Busterftw (#12) üzenetére


fatpingvin
őstag

egylépcsős fordítás, ígéretes.

az ötletedet mefg tárt karokkal várná sztem az AMD, az Intel, az InnoSilicon meg még elég sok más gyártó, beszéld meg a nvidiával hogy adják közre a CUDA-t. magam részéről ezt egy támogatandó ötletnek tartom.

annak viszont semmi értelme hogy a CUDA-t nyálazzuk és mondjuk a ROCm interoperabilitását úgy oldjuk meg hogy CUDA kódot ROCm-re frodítjuk. akkor már legyen egy független közös platform.

meg bocs de ne csináljunk már úgy mintha jó ötlet lenne lemenni kutyába egy amúgy is pozícióban lévő nagyvállalatnak.

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#14) Busterftw válasza fatpingvin (#13) üzenetére


Busterftw
veterán

De ez hogy egyeztetheto ossze a piaci versennyel amirol fentebb irtal?
Az AMD-nek es az Intelnek nem tart karokkal kellene ezt varni, hanem jobb megoldassal piacra lepni mint a konkurencia.

(#15) Abu85 válasza Busterftw (#14) üzenetére


Abu85
HÁZIGAZDA

Az Intelnek és az AMD-nek már van erre megoldása. Az AMD-ét nagyon sokan használják is, hiszen olyan sok supercomputing tendert nyernek manapság, hogy muszáj a HIP-re menni a CUDA-ról. De ugye ez könnyű, mert a HIP az egy CUDA másolat, tehát a meglévő CUDA kódok baromi egyszerűen vihetők. Ezért is tud az AMD nyerni annyi supercomputing tendert, mert már nem gond, ha CUDA-ban van meg a kód, az pár nap alatt meglesz HIP-ben is, és ennyi volt.

Viszont a piacnak a HIP csak egy második CUDA. A váltással nem nyertél semmit, csak annyit értél el, hogy innentől az AMD diktál. A valós megoldások az ilyen Open SYCL-höz hasonló implementációk, amelyek viszont egyik gyártóhoz sem kötődnek, miközben a gyártói rendszerek előnyeit is hordozzák. Ezzel már a kódot egy napig sem tart majd portolni, hanem megy azonnal más gyártóval. Tehát ha mondjuk úgy döntenek a következő körben a supercomputing tendereknél, hogy az AMD se elég jó, akkor nem gond, könnyen lehet menni mondjuk az Intelhez. Mert most ez még nem olyan könnyű sajnos.

Az NV-ról való elugrást az tette lehetővé, hogy az AMD szimplán előállt egy olyan csomaggal, ami kvázi megeszi a CUDA kódot, és köp helyette egy ugyanolyan gyors HIP kódot, de ez valójában nem megoldás. Ez csak az AMD-nek jó abban, hogy az új szuperszámítógépes alapokba bekerüljön az Instinct gyorsító, és főleg azt rendeljék a tendereken (lásd a mostani nagyágyúk, például HPE Cray EX235a, Atos BullSequana XH3000, stb.). Ez működik is a nagy projekteknél, de a piac ebből nem húz hasznot. Ez kizárólag az AMD-nek jó így.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#16) fatpingvin válasza Abu85 (#15) üzenetére


fatpingvin
őstag

köszi hogy kifejtetted. alapvetően ez a válasz.

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#17) Busterftw válasza Abu85 (#15) üzenetére


Busterftw
veterán

Nincs 2022-es adatom, de mi az a nagyon sok?
"In the latest Top500 list of supercomputers, 153 are running Nvidia accelerators while AMD only has nine. According to IDC, Nvidia held 91.4% of the enterprise GPU market to AMD’s 8.5% in 2021."

(#18) Abu85 válasza Busterftw (#17) üzenetére


Abu85
HÁZIGAZDA

Nézd meg az új kiépítéseket. Ahova HPE Cray EX235a vagy Atos BullSequana XH3000 megy, oda Instinctet kérnek már. Ez a Green500-on látszik leginkább, ahol a top10-ben hat darab HPE Cray EX235a van. És nagy teljesítménnyel vannak ott, nem aprócska teljesítménnyel, mint a többi négy top10-es. Az adja el ezt a konfigurációt, hogy skálázva is alig távolodik az 1-től a Power Usage Effectiveness paraméter. Ugyanezért ment a Atos is full AMD-re a BullSequana XH3000-nél, és így nekik is megvan ez az előnyük.

Az NV erre majd a Grace+gyorsító kombinációval tud reagálni. Az is 1-hez közeli PUE-t kínál majd masszív skálázás mellett is. De majd meg kell győzniük a piacot, hogy írjanak újra minden szoftvert ARM-ra.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#19) Busterftw válasza Abu85 (#18) üzenetére


Busterftw
veterán

Megneztem a Green500-as listat, az accelerator arany a kovetkezo, 2022 November:
Nvidia 169
AMD 9

A top 10-es lista teljesen irrelevans, mert az egesz rendszer energiahatekonysaga alapjan rankel a Green500.

Az Nvdianak teljesn mindegy, hogy Epyc/Xeon kerul a gyorsitoi melle, amig azok az o gyorsitoi. Persze most hogy jon a Grace, belenyulnak abba a piacba is.

[ Szerkesztve ]

(#20) Abu85 válasza Busterftw (#19) üzenetére


Abu85
HÁZIGAZDA

Az a lényege a Green500-nak, hogy melyik rendszer PUE mutatója van nagyon közel 1-hez. De a nagyobb konfigurációk esetében a skálázás nem optimális, így a PUE mutató erősen romlik. A HPE Cray EX235a ebből a szempontból egy olyan brutális áttörés, hogy a skálázás alig rontja a PUE mutatót, és emiatt annyira extrém sikeres ez a rendszer az új beszerzéseknél. Mindenki ilyet akar, mert extrém hatékony.

Az NV elsődlegesen azért fejleszti a Grace-t, mert EPYC és Xeon mellett nem tudnak ilyen PUE mutatót elérni, nem tudják úgy bekötni a gyorsítójukat, hogy ez lehetőség legyen. A HPE Cray EX235a abból szedi össze a brutális hatékonyságát, hogy nem PCI Express interfészen van bekötve az EPYC mellé az Instinct, így pedig a skálázást nem rontja le maga a PCI Express, amit a többi konfigon megtesz.
A másik jól skálázódó rendszer az Atos BullSequana XH3000, aminek az a különlegessége, hogy maradt a PCI Expressnél, de nem gyorsítót használ, hanem MI300-at, ami host CPU nélkül is üzemképes. Ilyenre semmilyen más gyorsító nem képes. És az Atos így kerüli el a összeköttetés skálázási limitációit.
Ha hatékonyságot akarsz, akkor nem az számít, hogy milyen hatékony a CPU és a gyorsító külön, hanem az, hogy miképpen van összekötve a kettő. Az NV-nek is van erre technológiája, lásd az NVLink, csak sem az EPYC, sem pedig a Xeon nem támogatja, és így nem tudnak bekerülni amodern x86/AMD64-es dizájnokba, mert a megrendelők inkább EPYC-hez és Xeonhoz tervezett gyorsítókat kérnek. Ezért kell az NV-nek a saját proci, mert abba tudnak rakni NVLinket. Viszont nyilván az ARM nehézsége lesz a szoftveres front. De az NV-nek nem mindegy, hogy milyen procit raksz a gyorsító mellé, mert EPYC és Xeon procival a gyorsítójuk messze nem olyan versenyképes, mint az AMD és az Intel házi dizájnjai. Ha versenyképes lenne, akkor az új HPC-s csúcskonfigurációk NV gyorsítóval jönnének és nem AMD-vel.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#21) fatpingvin válasza Abu85 (#20) üzenetére


fatpingvin
őstag

illetve hát a NVLink-hez annyit tennék hozzá hogy ugye x86 proci nincs a piacon, de a POWER még opció lenne, csak az most némileg le van maradva. ami elég nagy kár, a Power10-et érdemes lenne kicsit megtolni...

a 2010-es évek közepén még nagyot ment a POWER9, reggelire ette a hasonló műszaki kaliberű x86 dizájnokat, csak igen drága volt.

A tipikus munkafolyamat legjobb tesztszimulációja a tipikus munkafolyamat. A "napi anti-corporate hsz"-ok felelőse :)

(#22) Busterftw válasza Abu85 (#20) üzenetére


Busterftw
veterán

Ertem a lenyeget, en is irtam mirol szol a Green500 lista, viszont az aranyhoz semmi koze, szoval a "nagyon sok" ervedet en ujragondolnam.
Gyorsitok piacan Nvidia/CUDA egyeduralom van a mai napig.

(#23) Abu85 válasza Busterftw (#22) üzenetére


Abu85
HÁZIGAZDA

A teljes listában vannak több éve összerakott gépek is. Ezért szokás a top10-et nézni, mert oda csak az új gépek tudnak bekerülni, nem azok, amiket 8-10 éve építettek. És ha a top10-et nézed, akkor ott már gondok vannak az NV-nek, mert előkerült az a probléma, hogy az új konfigoknál a gyártók nem igazán keverik a CPU és a gyorsító gyártóját. Ez talán feltűnhetett az elmúlt időben, hogy ahonnan jön a CPU onnan jön a GPU is. Ha ez nem lenne probléma, akkor az NV nem törné magát, hogy legyen saját CPU-ja, de ma irtó nehezen kerülnek be EPYC és Xeon mellé a nagy projekteknél. Nulla olyan gépet látsz a top500-ban, amely a mostanában sláger HPE Cray EX235a konfiggal jön és NV gyorsító van benne. Pedig papíron bele lehetne erőszakolni, csak nem érdekel senkit, mert rosszabb lesz a PUE mutató.

Az Atos még kérdéses, mert ők most fejezték be a rivális BullSequana XH3000 fejlesztését. Technikailag ez is rendelhető Intel, AMD, NV mindenféle kiszerelésben, de mégis a default konfigurációja EPYC+Instinct, mert ennek a legjobb a PUE mutatója. Tehát a legtöbben ezt fogják rendelni, mert így működik a leghatékonyabban a gép.

A CUDA pedig nem sokat ér már, mert fentebb kifejtette fatpingvin, hogy ma már bőven van alternatívája. Sőt, az Instinct a meglévő CUDA kódot is futtatja HIP-ben. Ebből jött az egész vita, hogy mi a jó a piacnak, és nem az, hogy van a CUDA, illetve a HIP, bár nyilván látványos, ahogy a piac HIP-re megy, csak ettől még maga a szegmens nem nyer semmit, mert így csak az NV-t váltják AMD-re. A valós megoldás szoftveresen az Open SYCL-féle implemetációk, ami tényleg gyártófüggetlen. A mostani CUDA->HIP irányzattal kizárólag az AMD nyer, ahogy látványosan húzzák befele az új fejlesztésű gépeket az EPYC+Instict kombóval. Ezzel csak annyi történik, hogy az új Atos és Cray alapkonfigú gépek NV helyett Instinct gyorsítóval jönnek. Hurrá, egyik gyártótól elszakadtunk a másik karjaiba. Mit nyertünk vele? Semmit, csak a másik gyártónak ömlik a pénz, de a piac ettől nem járt jól.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#24) Busterftw válasza Abu85 (#23) üzenetére


Busterftw
veterán

Nem tudom milyen gondokrol beszelsz, amikor 31%-al nott a Datacenter, a gyorsitok piacan elsopro Nvidia uralom van es ezt epp most nyomja meg az AI forradalom.

Az alternativa pedig ahogy a fenti kepen mutatja nem sokat er, ha csak van.
Az szamit melyik a standard a piacon es ez a CUDA.

(#25) Abu85 válasza Busterftw (#24) üzenetére


Abu85
HÁZIGAZDA

Ketten is próbáljuk magyarázni, hogy a cégek a nagyobb gépekhez a HPE Cray részlegétől vagy az Atostól szerzik a rendszert. Ezeket skálázzák. Na most az elmúlt időszakban a HPE Cray EPYC+Instinct konfigot kínált, az Atos pedig szintén ilyen felállást kínál defaultban a most érkező rendszeréhez. Emiatt van az, hogy olyan sok új Instinct gép épült az elmúlt időszakban. Odamennek a megrendelők a HPE Cray és az Atos kapcsolattartóihoz, és megveszik, amit felkínálnak. Az meg manapság EPYC+Instinct.

A CUDA-t pedig még mindig nem érted. Tök mindegy, hogy egy csomó CUDA kódod van, ha a HIPify kiköpi neked hozzá a HIP kódot. Lefordítod és egy napon belül át is tértél CUDA-ról HIP-re. Ezért is veszik meg az Instinct gyorsítókat, mert az AMD pont ugyanolyan szintaxisú alternatívát használ, mint a CUDA. Gyakorlatilag lemásolták azt egy az egyben, így minden munka, minden befektetett dollármillió, amit az NV elvégzett évekig, az egy az egyben működik az AMD gyorsítóin is a másolattal. Ha nem így lenne, akkor nem törne fel az Instinct, mint a talajvíz.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#26) Busterftw válasza Abu85 (#25) üzenetére


Busterftw
veterán

En meg harmadszor kerdezem, mi az az olyan sok?
En hoztam piacrol szamokat, neked hol vannak a szamaid?

AMD datacenter revenue ugyan nagyobb, de ez tobbsegeben az CPU-knak koszonheto, nem a gyorsitoknak.

(#27) Abu85 válasza Busterftw (#26) üzenetére


Abu85
HÁZIGAZDA

Mondtam, hogy nézd meg a Green500 top10-et, amiben mindig látszódnak a legújabb gépek. Ez a rész azért változik sűrűn, mert az új építésű konfigok legyakják a régi építésűeket.

Mindkettőnek köszönhető, hiszen pont az a helyzet, hogy az EPYC eladja az Instinctet. Lásd az új HPC gépek a HPE Craytől és Atostól. Amelyikben EPYC van, abban Instinct is van. A gyártók keverése alábbhagyott rendesen, mert nem elég hatékony úgy a rendszer.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.