SUPERKOMPIUTERIAI

TurinysĮVADAS 31. KAS TAI SUPЕRESM? 42. ŠIUOLAIKINIŲ SUPERESM ARCHITEKTŪRA 62.1. Vektoriniai superkompiuteriai [SIND] 72.2. Daugiaprocesoriniai vektoriniai superkompiuteriai [MIMD] 92.3. [MIMD] Klasteriai 92.4. МРР – sistemos [MIMD] 103. DAUGIAPROCESORINIAI SMP – SERVERIAI SU RISC ARCHITEKTŪROS MIKROPROCESORIAIS 134. SUPERESM NAŠUMO ĮVERTINIMAI 155. SUPERKOMPIUTERIŲ PANAUDOJIMO SRITYS 17APIBENDRINIMAS 21NAUDOTA LITERATŪRA 22ĮvadasDialektinė kompiuterinių technologijų vystymosi spiralė apsuko dar vieną savo vingį – šiandien, kaip ir prieš dešimt metų, vėl madingomis tapo superkompiuterinės architektūros. Be abejo, tai daugiau nebe tie monstrai, kuriuos prisimena veteranai – naujos technologijos ir reikli kompiuterių panaudojimo komercijoje rinka iš pagrindų pakeitė šiuolaikinio kompiuterio išvaizdą. Šiuolaikinis superkompiuteris – tai ne didelės spintos su unikalia technologija, aplink kurią buria magai-informatikai, o visiškai kompaktiškos sistemos su puikiai įdiegta aprūpinimo sistema, tinkančia dirbti su kitų tipų kompiuteriais. Šio darbo tikslas – apžvelgti šiuolaikines superESM1 bei jų ateities perspektyvas. Darbe bus aptartos pagrindinės superkompiuterių panaudojimo galimybės ir išanalizuotos skirtingų architektūros tipų ypatybės, būdingos šiuolaikiniams superkompiuteriams.

1. Kas tai supеrESM?Oksfordo skaičiavimo technikos žodynas, išleistas beveik prieš dvidešimt metų, 1986 m., teigia, kad superkompiuteriai – tai labai galingos ESM, kurių darbo našumas didesnis nei 10 MFLOPS (milijonai slankiojo kablelio operacijų per sekundę). Šiuo metu šį rezultatą jau gali pasiekti ne tik darbo stotys, bet ir masiškai gaminamas PK. 90-tųjų pradžioje buvo pasiekta 300 MFLOPS darbo sparta. Šiais metais, remiantis spaudoje pateiktais duomenimis, specialistai dviejų pirmaujančių „superkompiuterinių“ šalių – JAV ir Japonijos – susitarė pakelti gardelę iki 5 GFLOPS. Tačiau toks superkompiuterių išskyrimas nelabai teisingas. Akivaizdu, kad kiekvienas, nors ką nors išmanantis apie kompiuterius, dviejų procesorių kompiuterį Cray C90 gali pavadinti superESM, nors jo darbo galingumas mažesnis nei 2 GFLOPS. Su šiuo klausimu glaudžiai susiję apribojimai dėl didelio našumo skaičiavimo technikos tiekimo kitoms šalims. Kompiuteriai su darbo sparta didesne nei 10 000 mln. teoriškų operacijų per sekundę yra laikomi superkompiuteriais.

Būtų tikslinga išvardinti pagrindinius bruožus, charakterizuojančius superESM, tarp kurių be aukšto galingumo reikėtų išskirti: · patį naujausią technologinį lygį (pvz.: GaAs technologijas2);· specifiškus architektūros pakeitimus, susijusius su spartos padidinimu (pvz.: operacijų skaičius vektoriuose);· kainą, kuri dažniausiai būna 1-2 mln. dolerių.Superkompiuterių telekonferencijoje USENET dėl greito RISC3-mikroprocesorių tecnologijų vystymosi ir vis didėjančio jų gaminimo buvo užduotas toks klausimas: „Kada darbo stotis virs superkompiuteriu?“ Buvo gautas toks atsakymas: „Kada ji kainuos daugiau nei 1 mln. dolerių.“ Galima pridurti, kad kompiuteris Cray-1 savo laiku kainavo apie 8 mln. dolerių, o šiais metais paskelbta, kad superkompiuteris Сгау Т90, turintis daug didesnę darbo spartą, kainuoja – nuo 25 iki 35 mln. dolerių, o superkompiuterių MPP4-sistemos projekto sukūrimas laboratorijoje Sandia JAV Energetikos Ministerijai kainavo 46 mln. dolerių.Be to, yra tokių kompiuterių, kurie turi visus čia išvardintus bruožus, charakterizuojančius superESM, išskyrus kainą, kuri jų atveju yra nuo kelių šimtų iki 2 mln. dolerių. Tai mini-superESM, turinčios didelį darbo našumą ir jas pralenkia tik didelės superESM. Mini-superESM turi daug geresnį kainos ir gamybos santykį ir daug žemesnes eksplotacines išlaidas: šaldymo sistemą, elektros maitinimą, reikiamos vietos dydį ir t. t. Šie kompiuteriai orientuoti į mažesnius skaičiavimo centrus – fakulteto, o ne viso universiteto ar organizacijos mastu. Pavyzdžiai tokių kompiuterių gali būti ESM – Cray J90, Convex C38XX. Prie jų galima priskirti tokias superkmpiuterių sistemas su RISC mikroprocesoriais, kaip pavyzdžiui IBM SP2, SGI POWER CHALLENGE, DEC AlphaServer 8200/8400 ir kitos.Mini-superkompiuterio architektūra nėra ypatinga todėl toliau nebus nagrinėjama.

2. Šiuolaikinių superESM architektūraŠiame skyriuje bus apžvelgtos tik tos superkompiuterių architektūros, kurios yra plačiai paplitusios šiandieną ir pateiksime klasikinę Flinn’o superkompiut…erių klasifikaciją. Pagal šią sistemą superkompiuteriai yra skirstomi į keturias klases pagal komandų ir duomenų srautų skaičių [3].

Pav.1 Flinn’o superkompiuterių klasifikacijaPirmai klasei (John von Neuman architektūra) priklauso paprastos skaliarinės vienprocesorinės sistemos: vienas komandų srautas – vienas duomenų srautas (SISD). Personalinis kompiuteris turi SISD architektūrą, nepriklausomai nuo to ar naudojami PK konvėjariai, greitinantys operacijų vykdymą.Antroji klasė charakterizuojama vienu komandų srautu, bet dideliu duomenų srautų skaičiumi (SIMD). Šiam architektūros stiliui priklauso vienprocesoriniai vektoriniai, o tiksliau sakant, vektoriniai-konvėjariniai superkompiuteriai, pvz.: Cray-1. Šiai klasei būdingas vienas (vektorinių) komandų srautas su daugeliu duomenų srautais – kiekvienas vektoriaus elementas įeina į atskirą duomenų srautą. Šios klasės skaičiavimo sisemoms priklauso matriciniai procesoriai, pvz.: ILLIAC-IV. Jie taip pat turi vektorines komandas ir vektorinį apdorojimą, tačiau ne su konvėjariais, kaip vektoriniai superkompiuteriai, o su matriciniais procesoriais.Trečiai klasei – MIMD – priklauso sistemos, turinčios daug tiek komandų, tiek duomenų srautų. Jai priklauso ne tik daugiaprocesorinės vektorinės superESM, bet ir apskritai visi daugiaprocesoriniai kompiuteriai. Dauguma šiuolaikinių superESM turi MIMD architektūrą.Ketvirtoji klasė Flino klasifikacijoje, MISD, neturi didelės reikšmės mūsų analizuojamiems kompiuteriams. Šiuo metu literatūroje dažnai naudojamas SPMD terminas (viena programa – daug duomenų), kuris nepriklauso kompiuterio architektūrai, o yra tik modelis lygiagrečiai dirbančių programų, todėl nėra įtrauktas į Flinn’o klasifikaciją. SPMD dažniausiai priklauso MPP (t. y. MIMD) – sistemoms ir reiškia, kad keletas programų kopijų yra vykdoma lygiagrečiai skirtinguose procesoriniuose mazguose su skirtingais duomenimis. Įdomu būtų paminėti visai kitokią kompiuterių architektūros vystymosi kryptį – mašininį duomenų srautą. 1980 m. viduryje daugelis mokslininkų manė, kad didelio našumo ESM ateitis yra susijusi būtent su kompiuteriais, kurie būtų valdomi duomenų srautais, skirtingai nei anksčiau mūsų išvardintos skaičiavimo sistemų klasės, valdomos komandų srautais. Duomenų srautų mašinose vienu metu gali būti vydomos keletas komandų, kurioms yra skirti operandai. Nors tokios architektūros ESM dabar nėra gaminamos, tačiau vektoriniai elementai rado savo atspindį šiuolaikiniuose superskaliariniuose mikroprocesoriuose, turinčiuose daug lygiagrečiai dirbančių funkcinių prietaisų ir buferinių komandų, laukiančių operandų pasiruošimo dirbti. Kaip pavyzdį tokio mikroprocesoriaus galima pateikti HP РА-8000 ir Intel Pentium Pro.

Nors superESM architektūros nagrinėjimą remiantis Flinn’o klasifikacija derėtų pradėti nagrinėti nuo SISD klasės, tačiau visos vektorinės-konvėjarinės (toliau – tiesiog vektorinės) superESM turi “ne mažesnę” kaip SIMD architektūrą. Kalbant apie superkompiuterių serverius, naudojančius šiuolaikinius didelio našumo mikroprocesorius, tokius kaip SGI POWER CHALLENGE R8000 arba DEC AlphaServer 8200/8400 Alpha 21164, tai jų minimalios konfigūracijos būna vienprocesorinės. Nenagrinėjant šių mikroprocesorių architektūros, reikėtų išanalizuoti daugiaprocesorinės konfigūracijos serverių architektūros ypatybes, todėl superkompiuterių architektūra pradedama nagrinėti nuo SIMD klasės.2.1. Vektoriniai superkompiuteriai [SIND]Tarp šiuolaikinių superESM šią architektūrą turi vienprocesoriniai vektoriniai superkompiuteriai. Praktiškai visi ji yra išleidžiami multiprocesorinėse konfigūracijose, priklausančių MIMD klasei. Tačiau dauguma vektorinių superESM architektūros ypatybių galima suprasti nagrinėjant netgi vienprocesorines sistemas. Tipišką vienprocesorinio vektorinio superkompiuterio schemą pateikia japonų firmos Fijitsu FACOM VP-200 pavyzdys. Panašią architektūrą turi ir kiti vektoriniai supekompiuteriai, pvz.:firmų Cray Research ir Convex. Bendras visiems vektoriniams kompiuteriams yra skaičius vektorinių operacijų komandų sistemoje. Tokiuose kompiuteriuose operacijos su vektoriais dažniausiai atliekamos su vektoriniais registrais, kas visai nėra būtina. Registrų skaičius leidžia atlikti vektorines komandas ne su visais vektorių elementais, o tik su tais, kurie yra nurodomi. Be abejo, skirtinguose kompiuteriuose vektorinės architektūros panaudojimas remiasi savosiomis šios bendros schemos modifikacijomis. Taip, pavyzdžiui, skaičiavimo sistemose kompanijos Fujitsu serijos VP įgyvendinta galimybė konfigūruoti vektorinius registrus – galima, pavyzdžiui, padidinti ilgį vektorinių registrų tuo pat metu proporciškai mažinant jų skaičių. Nuo Cray-1 laikų daugelis vektorinių kompiuterių, taip pat ir firmos Fujitsu ESM serijos VP ir serijos S kompanijos Hitach, turi svarbią vektorinių skaičiavimų pagreitinimo priemonę. Pateikiamas eiliškumas komandų, dirbančių su vektoriniais V-registrais Cray kompiuteriuose:

V2=V0*V1V4=V2+V3Aišku, kad antroji komanda negali būti vykdoma iš kart po pirmosios – todėl pirmoji komanda turi suformuoti V2 registrą, kas reikalauja nustatyto taktų skaičiaus. Komandų pagreitinimo priemonė leidžia antrajai komandai pradėti dirbti, nelaukiant, kol pirmoji bus visiškai baigta: tuo pat metu, kai atsiras pirmasis rezultatas V2 registre, jo kopija yra nukreipiama į funkcinį sumavimo įrenginį, ir paleidžiama antroji komanda. Žinoma, komandų pagreitinimo priemonės galimybės skiriasi skirtingose ESM.Naudojant skaliarinį apdorojimą, atitinkama komandų posistemė japoniškuose kompiuteriuose Fujitsu ir Hitachi suderinama su IBM/370, kas turi didelių pranašumų. Čia skaliarinių duomenų buferizacijai naudojama tradicinė keš-atmintis. Kompanija Cray Research, priešingai, pradedant nuo Сгау-1, atsisakė nuo keš-atminties naudojimo. Vietoj jos kompiuteriuose naudojami specialūs programiškai adresuojami buferiniai В ir Т-registrai. Ir tik paskutinėje serijoje, Cray T90, buvo įrengta tarpinė keš-atmintis skaliarinėms operacijoms. Reikia pabrėžti, kad trakte operatyviosios atminties-vektorinių registrų tarpinės buferinės atminties nėra, todėl būtinai reikia turėti aukštą posisteminės atminties pralaidumą, norint palaikyti didelį skaičiavimo greitį, greitai talpinti duomenis į verktorinius registrus ir įrašyti rezultatus atgal į atmintį.Iki šiol buvo aptartos vektorinės ESM, kuriose atitinkamų komandų operandai buvo išdėstyti vektoriniuose registruose. Be jau minėtų kompiuterių Fujitsu ir Hitachi, vektorinius registrus turi kitos japonų firmos NEC kompiuteriai serijos SX, taip pat patys galingiausi ESM serijos SX-4 ir visi vektoriniai kompiuteriai ne tik Cray Reseach firmos (C90, М90 ir Т90), bet ir Cray Computer (Cray-3 ir Cray-4) bei vektorinės minisuperESM firmos Convex (Cl, С2, С3 ir C4/XA).Tačiau kai kurios vektorinės superESM, kaip IBM ES/9000, dirba su operandais – vektoriais, išdėstytais operatyviojoje atmintyje. Greičiausiai, toks priėjimas yra mažiau perspektyvesnis gamybos požiūriu, todėl, norint palaikyti aukštą skaičiavimo tempą kiekvienai vektoriniai komandai, reikalingas greitas vektorinių operandų išėmimas iš atminties ir rezultatų įrašymas atgal.2.2. Daugiaprocesoriniai vektoriniai superkompiuteriai [MIMD]

Visi vektoriniai superkompiuteriai yra gaminami daugiaprocesorinėse konfigūracijose, kurios jau priklauso MIMD klasei. Daugiaprocesorinių vektorinių kompiuterių architektūroje galima išskirti svarbiausias charakteristikas: visų sistemos procesorių simetriškumą ir visų procesorių operatyviosios atminties bendro lauko padalijimą. Panašios kompiuterių sistemos dar yra vadinamos stipriai surištomis. Jei vienprocesorinėse vektorinėse ESM, norint sukurti efektyvią programą, reikia ją suvektorizuoti, tai daugiaprocesorinėse atsiranda programos išlygiagretinimo uždavinys, norint ją vykdyti vienu metu keliuose procesoriuose. Tai yra turbūt sunkesnis uždavinys, nes reikia suvienodinti lygiagrečiai dirbančių procesorių darbą. Praktika parodė efektyvaus didesnio algoritmų skaičiaus naudojimo galimybes nagrinėjamoms stipriai surištoms sistemoms. Toks požiūris kartais vadinamas bendros atminties padalinimo modeliu. 2.3. [MIMD] KlasteriaiKlasteriai yra pats pigiausias būdas didinti jau instaliuotų kompiuterių darbo našumą. Klasteris – tai rinkinys iš keletos ESM, sujungtų per komunikacinę infrastuktūrą. Tokia stuktūra gali būti paprastas kompiuterinis tinklas, tačiau našumui didinti pageidautina turėti greitaeiges jungtis (FDDI/ATM/HiPPI ir t.t.). Klasteriai gali būti sudaryti tiek iš skirtingų kompiuterių (heterogeniniai klasteriai), tiek iš vienodų (homogeniniai klasteriai). Visos tokios sistemos priklauso MIMD klasei. Klasteriai yra klasikinis silpnai surištų sistemų pavyzdys.Klasterinių sistemų pranašumas prieš SMP7-serverius yra tinklo papildymo savybių pagerinimas. Skirtingai nuo serverių SMP-architektūros, kur konfigūracijos plėtimą riboja magistralės praleidžiamoji galia, klasterio papildymas kompiuteriais leidžia padidinti operatyviosios atminties ir įvesties-išvesties posistemių praleidžiamąją galią.Klasterinėse sistemose procesorių bendradarbiavimo organizavimui, skirtinguose kompiuteriuose atliekant vieną užduotį, naudojami skirtingi pasikeitimo pranešimais moduliai (PVM, MPI ir t.t.). Tačiau užduoties paskirstymas tokiose sistemose su paskirstyta atmintimi tarp skirtingų kompiuterių šių modelių ribose yra daug sudėtingesnis negu atminties bendro lauko modelyje, kaip SMP-serveriuose. Reikia pridurti, kad yra vien tik techninių problemų: sulaikymai keičiantis duomenimis ir duomenų perdavimo greičio padidėjimas, todėl užduočių, kurios gali efektyviai būti išspręstos klasterinėse sistemose, kiekis yra pakankamai ribotas, lyginant su simetriškomis stipriai surištomis sistemomis. Lygiagrečiam užklausų į duomenų bazes apdorijimui panašiose sistemose taip pat yra savos priemonės.

Į klasterius gali jungtis skirtingi superkompiuteriai, kaip minisuperESM Сгау J90, tačiau patys žymiausi pasaulyje superESM klasteriai yra IBM SP2 [4] ir SGI POWER CHAL ENGEarray. Galimybė naudoti didelį kiekį procesorinių mazgų SP2 leidžia tuo pat metu priskirti šį kompiuterį ir MPP-sistemos klasei.2.4. МРР – sistemos [MIMD]Pagrindinis rodiklis, pagal kurį sistema yra priskiriama MPP-architektūrai, yra procesorių skaičius (n). Griežtos ribos nėra, bet dažniausiai manoma, jei n >= 128 – tai sistema priklauso MPP klasei, jei n <= 32 – tai sistema nėra MPP-architektūros. Nėra būtina, kad MPP-sistema turėtų paskirstytą operatyviąją atmintį, kuri leidžia kiekvienam procesoriniam mazgui turėti savo lokalinę atmintį. Kompiuteriai SPP1000/XA ir SPP1200/XA – pavyzdys sistemų, kurių atmintis fiziškai padalinta tarp hipermazgų, bet loginė atmintis yra bendra visoms ESM, tačiau dauguma MPP-kompiuterių turi tiek logiškai, tiek fiziškai paskirstytą. atmintį Bet kokiu atveju, MPP-sistemos priklauso MIMD klasei. MPP-kompiuterių su paskirtyta atmintimi architektūra yra klasterinės sistemos praplėtimas didesniu mazgų skaičiumi, todėl tokioms sistemoms yra būdingi visi klasterių pranašumai ir trūkumai. Be to, procesorinių mazgų skaičiaus padidinimas gali virsti ne vien tik pliusais, bet ir minusais (procesorinis mazgas tai ESM blokas, kuris gali išlaikyti keletą procesorių, pvz.: kompiuteriuose SNI/Pyramid RM1000 ir patys turi SMP architektūrą).Būtent MPP-sistemos šiandien pasiekė kompiuterio didžiausią našumą, o geriausias pavyzdys – Intel Paragon. Kita vertus, paskirstymo problemos MPP-sistemose lyginant su klasteriais, kurie turi mažai procesorių, tampa vis sunkiau išsprendžiamos. Be to, našumo prieaugis gana greitai mažėja augant procesorių skaičiui. Lengva didinti ESM našumą teoriškai, tačiau daug sunkiau rasti sprendimą, kuris sugebėtų efektyviai apkrauti procesoriaus mazgus.Šiandieną ne taip jau dažnai MPP-kompiuteriai yra taikomi efektyviai, be to egzistuoja programų pernešimo problema tarp MPP-sistemų, turinčių skirtingą architektūrą. Paskutiniais metais bandymas standartizuoti pasikeitimo duomenimis modelius dar neišsprendžia visų problemų. Paskirstymo efektyvumas daugeliu atveju priklauso nuo MPP-sistemos procesorinių mazgų sujungimo topologijos. Pati efektyviausia galėtų būti topologija, kurioje bet kuris mazgas galėtų tiesiogiai susijungti su kitu bet kuriuo mazgu, tačiau MPP-sistemose tai techniškai sunkiai įgyvendinama. Dažniausiai procesoriniai mazgai šiuolaikiniuose MPP-kompiuteriuose sudaro arba dvimatę tinklinę (pvz.: , в SNI/Pyramid RM1000), arba hiperkubinę (kaip superkompiuteriuose nCube) struktūrą. Kadangi lygiagrečiai mazguose vykdomų procesų suvienodinimui būtinas pasikeitimas pranešimais, kurie turi nueiti iš vieno sistemos mazgo į kitą, svarbia charakteristika yra sistemos diametras su 1 – maksimalus atstumas tarp mazgų. Dvimatės tinklinės struktūros atveju d ~ sqrt(n), o hiperkubinės – d ~ 1n(n), todėl, padidinus mazgų skaičių, hiperkubo architektūra tampa daug naudingesnė. Informacijos perdavimo laikas nuo vieno mazgo į kitą priklauso nuo pradinio uždelsimo ir perdavimo greičio. Bet kuriuo atveju, perdavimo metu procesoriaus mazgai suspėja įvykdyti daug komandų, ir šis procesoriaus mazgų ir perduodančios sistemos greičių atitikimas, tikriausiai, išliks – pažangumas procesorių gamyboje kur kas didesnis nei ryšio kanalų pralaidumo srityje, todėl ryšių kanalų infrastruktūra yra viena iš svarbiausių MPP-kompiuterio sudedamųjų dalių. Vektorinių superESM gamybos pasaulinė lyderė, kompanija Cray Research, gamindama Cray T3D ir Cray ТЗЕ kompiuterius, taip naudojo ne vien tik vektorines sistemas, bet įdiegė MPP-sistemas, o naujausias JAV energetikos ministerijos superkompiuterių projektas bus pagrįstas MPP-sistema su Pentium Pro.

Nepaisant visų sunkumų, MPP-kompiuterių panaudojimo sritis po truputį plečiasi. Remiantis TOP500 sąrašo informacija [4], šiandien MPP-sistemos yra naudojamos daugelyje pirmaujančių pasaulio šalių superkompiuteriniuose centruose.

3. Daugiaprocesoriniai SMP – serveriai su RISC architektūros mikroprocesoriaisKai kurių šuolaikinių RISC architektūros mikroprocesorių gamyba sugretinama su vektorinių kompiuterių procesorių gamyba. Todėl atsirado naujos architektūros superESM, pasinaudojusios šiais pasiekimais, –… glaudžiai surišti MIMD klasės kompiuteriai – simetriški daugiaprocesoriniai serveriai su bendru operatyviosios atminties lauku. Šioms perspektyvioms sistemoms verta skirti daugiau dėmesio nei kitoms kompiuterių architektūroms, nes klausimai, susiję su šia tema, nėra išsamiai nagrinėjami literatūroje. Patys žinomiausi kompiuteriniai serveriai, turintys panašią SMP-architektūrą yra DEC AlphaServer 8200/8400 ir SGI POWER CHALLENGE. Jiems būdinga didelio našumo sisteminė magistralė, į kurios lizdus įstatomi trijų tipų moduliai – procesoriniai, operatyviosios atminties ir įvesties-išvesties. Įprastos, daug lėtesnės įvesties-išvesties magistralės, kaip PCI arba VME64, prijungiamos jau prie įvesties-išvesties modulių. Akivaizdu, kad tokia konstrukcija turi aukštą modulumo lygį ir lengvai leidžia ją didinti, o ribojačiais elementais tampa tik sisteminės magistralės lizdų skaičius ir jos našumas. Atminties moduliuose dažniausiai naudojama DRAM8 technologija, kuri leidžia pasiekti didesnės atminties apimties mažomis kainomis. Tačiau keitimosi duomenimis greitis tarp procesoriaus ir atminties tokiuose serveriuose yra daug kartų mažesnis negu analogiško trakto vektorinėse superESM, kur operatyvioji atmintis gaminama pagal daug brangesnę technologiją ЯВАМ. Čia ir yra esminis skirtumas tarp superkompiuterinių skaičiavimo metodų, naudojamų daugiaprocesoriniuose vektoriniuose ESМ ir SMP serveriuose, kur yra nedidelis vektorinių registrų skaičius, todėl, kaip jau buvo minėta, dėl aukšto našumo palaikymo reikia greitai pildyti į juos duomenis arba, atvirkščiai, užrašinėti iš jų informaciją į operatyviąją atmintį. Tokiu atveju reikalingas aukštas trakto procesoriaus-atminties našumas.

SMP-serveriuose atminties modulių praleidžiamoji galia daug mažesnė, o bendras apsikeitimo duomenimis su procesoriniais moduliais greitis ribojamas, nors ir aukšta magistralės praleidžiamąja galia. Be to, sisteminė magistralė gali būti užimta duomenų perdavimu, kai dirba įvesties-išvesties moduliai. Pavyzdžiui, garantuota sisteminės magistralės TurboLaser AlphaServer’eryje 8200/8400 praleidžiamoji galia sudaro 1,6 Gbaitų/s ir 1,2 Gbaitų/s – magistralės POWERpath-2 POWER CHALLENGE’yje, o operatyviosios atminties praleidžiamoji galia Сrау Т90 lygi 800Gbait7/s, todėl SMP-serveriuose kūrėjai stengiasi sumažinti poreikį keistis duomenimis procesoriaus-atminties trakte: vietoj mažos pagal dydį vektorinių registrų atminties apimties (būtent todėl jie reikalauja dažnos perkrovos) mikroprocesriai kompiuterinėse SMP-sistemose maitinami didelio dydžio keš-atmintimi, pvz.: po 4Mbaitų kiekvienam mikroprocesoriui AlphaServer’yje 8200/8400 ir POWER CHAL ENGE’ryje, todėl labai daug sprendžiamų uždavinių yra išsprendžiama.Šiuolaikiniai SMP-architektūros kompiuteriai dažniausiai turi charakteristikas, artimas didelėm vektorinėm superESM, išskyrus operatyviosios atminties spartą. Jei dar pridėti žemas SMP-sistemos aptarnavimo eksplotacines išlaidas, tai tampa aišku, kodėl šių, kur kas pigesnių kompiuterių (palyginus su vektoriniais) naudojimas per paskutinius 2 metus pastebimai išaugo.Analizuojamos SMP-sistemos ne būtinai turi turėti magistralinę architektūrą. Vietoj magistralės gali būti naudojamas komutatorius, kuris naudojamas kompiuterių Convex Exemplar SPP hipermazguose.

4. SuperESM našumo įvertinimaiKadangi superkompiuteriai tradiciškai buvo naudojami atliekant skaičiavimus su realiaisiais skaičiais, tai daugiausia šiandieninių našumo vertinimų yra susiję būtent su šiais skaičiavimais. Visų pirma, jiems priklauso maksimalus našumas, matuojamas milijonais slankiojo kablelio operacijų skaičiumi, kurį teoriškai kompiuteris gali įvykdyti per 1 sekundę (MFLOPS). Maksimalus našumas – dydis, praktiškai nepasiekiamas. Tai dažniausiai susiję su funkcionalinių konvėjarinių įrenginių užpildymo problemomis, kas yra būdinga ne tik vektorinėms superESM, bet ir kompiuteriams su RISC-architektūros mikroprocesoriais. Ypač tai svarbu mikroprocesorių superkonvėjarinei architektūr…ai, pvz DEC Alpha, kuriai būdinga naudoti pakankamai ilgus konvėjarius. Kuo didesnis konvėjaris, tuo daugiau reikia „inicializacinio“ laiko jį užpildyti. Tokie konvėjariai efektyvus dirbant su ilgais vektoriais, todėl superESM įvertinimui buvo įvesta tokia sąvoka, kaip pusinis našumas – vektoriaus ilgis, prie kurio pasiekiama pusė maksimalaus našumo. Daug realesni našumo įvertinimai grindžiami skirtingų testų atlikimo laiku. Žinoma, patys geriausi testai yra vartotojo užduotys, tačiau tokie įvertinimai visų pirma gana specifiniai, o antra, dažnai neprienami arba jų iš vis nėra. Dažniausiai naudojami universalesni testai, tačiau jie nėra naudojami tradicinės metodikos mikroprocesorių našumui vertinti (SPEC). Tai susiję dažniausiai su jų mažu informatyvumu superkompiuteriniams priedams (ypač SPEC 92), nors naujas standartas SPEC 95 pateikia daug realesnių žinių apie našumą. Šiandien yra tik SPEC įvertinimai superkompiuteriams, naudojantiems RISC-architektūros mikroprocesorius. Neseniai buvo paskelbtas specialus naujas SPEChpc96 standartas. Kadangi didžiąją dalį programos vykdymo laiko dažniausiai užima ciklai, tai būtent jie yra naudojami kaip testai, žinomi kaip liverio ciklai. Pačiu populiariausiu šiuo metu našumo įvertinimo testu galima pripažinti Linpack, kuris pateikia sistemos I linijinių lygybių sprendimą Gauso metodu. Kadangi yra žinoma, kiek operacijų su realiaisiais skaičiais reikia padaryti, norint išspręsti sistemą, ir žinant skaičiavimo laiką, galima apskaičiuoti operacijų skaičių, atliekamų per sekundę. Yra keletas šių testų variantų. Dažniausiai firmos-kompiuterių gamintojos pateikia rezultatus, kai N=100. Laisvai platinama Fortrano standartinė programa, kurią reikia įvykdyti superkompiuteriu, norint gauti testavimo rezultatą. Ši programa negali būti pakeista, išskyrus poprogramių iškvietimų pakeitimą, duodantį priėjimą prie procesorinio vykdymo laiko. Kitas standartinis testas skirtas, kai N=1000 ir reikia naudoti ilgus vektorius. Šie testai gali būti vykdomi kompiuteriuose, esant skirtingam procesorių skaičiui.

MPP-sistemoms tinkamesnis yra Linpack-parallel testas, kuriame našumas matuojamas didžiosiomis I.. Čia lyderiu yra 6768 procesorinis Intel Paragon (281 GFLOPS esant N =128600), kai N=100, lyderiauja Cray T916 (522 MFLOPS), o kai N=1000 ir pagal maksimalų našumą – Hitachi S3800(atitinkamai 6431 ir 8000 MFLOPS). Palyginimui, AlphaServer 8400 procesorius turi 140 MFLOPS, kai N=100, ir 411 MFLOPS, kai N=1000. Paskutiniu metu vis dažniau yra naudojami NAS parallel benchmark testai, kurie ypač tinka dujų ir hidrodinamikos uždaviniams spęsti. Jų trūkumas yra sprendimo algoritmo, o ne programos teksto fiksavimas.

5. Superkompiuterių panaudojimo sritysKokiam tikslui yra naudojama tokia brangi technika? Galima manyti, kad didėjanti namų PK ir darbo stočių gamyba, o taip pat ir severių panaudojimas gali sumažinti superkompiuterių paklausą. Tačiau taip nėra. Viena vertus, dauguma užduočių gali būti sėkmingai atliekama darbo stotyse, tačiau laikas parodė, kad nuolat atsirandantys vis nauji projektai verčia vis dėlto naudoti superESM. Svarbu paminėti superESM patekimą į jiems anksčiau neprieinamą komercinę sritį. Kalbama ne tik apie grafinius paketus filmams ar televizijai, kur ypač rekalinga didelė darbo eiga (milijonai slankiojo kablelio operacijų per sekundę), bet ir sprendžiant kitokius uždavinius, kur reikalingas intensyvus ir operatyvus duomenų apdorojimas, pavyzdžiui, naudojant superdideles duomenų bazes. Prie šių uždavinių galima taip pat priskirti sprendimų paramos sistemas bei informacijos sandėlių organizavimą. Žinoma, galima teigti, kad darbui su šiais projektais visų pirma reikalingas didelis įvedimo-išvedimo našumas ir didelė darbo sparta atliekant skaičiavimo operacijas, o labiausiai tinkamos kompiuterių sistemos tokiems darbams galėtų būti Tandem kopmanijos MPP sistemos Himalaya, AlphaServer 8400. Dažniausiai reikalavimai superESM kyla iš daugybės branduolinės fizikos sprendžiamų uždavinių. Ju…k branduolinė fizika – tai klasikinė superESM panaudojimo sritis nuo pat jų atsiradimo.Tradicinė superESM panaudojimo sfera visada buvo moksliniai tyrimai chemijoje, fizikoje, biologijoje. Be abejo, daugelis sričių yra sandūroje keletos mokslų, (pavyzdžiui, chemijos ir biologijos) ir persipina su techniniais uždaviniais. Kaip ir fizikoje, taip ir meteorologijoje kai kuriems uždaviniams išspręsti (ištirti atmosferos pokyčius ir kuo greičiau pateikti oro prognozes) neužtenka superESM galingumo, todėl naudojamos superESM kompiuterinės sistemos.

Apžvelgsime 3 didžiąsias kompiuterines sistemas:· ASCI White, Lawrence Livermore laboratorijoje: baigtas statyti 2000 metų birželį, ASCI White yra galingiausias šiuo metu veikiantis superkompiuteris. Šis superkompiuteris veikia Lawrence Livermore laboratorijoje, JAV ir daugiausiai naudojamas kariniais tikslais. Be akivaizdžių masinio naikinimo ginklo gamybos ar lėktuvų ir raketų konstravimo uždavinių, galima paminėti pvz.: begarsių povandeninių laivų konstavimą ir kt. Pats žymiausias pavyzdys – tai amerikiečių SOI programa. Jau minėtą MPP kompiuterį JAV energetikos Ministerija naudos modeliuojant branduolinį ginklą, kas leis visiškai atsisakyti branduolinių bandymų toje šalyje.

Pav.2 ASCI White superkompiuteris

· Blue Horizon, Sandiegas: Pastatytas IBM ir yra didžiausias JAV studijų reikmėms naudojamas superkompiuteris, užima 8 vietą pasaulyje pagal galingumą, naudojamas visdada buvo moksliniai tyrimai: plazminė fizika ir statinė mechanika, molekulinė ir atominė fizika, elementariųjų dalelių teorija, astrofizika ir t. t. Chemijoje – kvantinė chemija, molekulinė dinamika, cheminė kinetika, vaistų gamyba.

Pav.3 Blue Horizon superkompiuteris · SR8000 F1, Miunchenas: Šis superkompiuteris, pastatytas Leibnico tyrimų centro 2000-jų pradžioje, yra galingiausias kompiuteris Europoje. Naudojamas studijų reikmėms.

Pav.4 SR8000 F1 superkompiuterisTarp techninių problemų, kurioms išspręsti naudojami superkompiuteriai, nurodysime aerokosminės ir automobilių gamybos, branduolinės energetikos, naudingųjų iškasenų, naftos gavybos, pagaliau ir naujų mikroprocesorių bei kompiuterių, o pirmiausia superESM gaminimo uždavinius.Analizuojant galimus reikalavimus, keliamus superESM, galima juos išskirti į dvi grupes. Pirmai galima priskirti uždavinius, kuriuose būtų aišku, kokį našumo lygį reikia pasiekti kiekvienu konkrečiu atveju, pvz.: skubų oro pranešimą. Antrajai galima priskirti uždavinius, kuriems išspręsti reikia greitai apdoroti labai didelį duomenų kiekį. Pavyzdžiui, kvantinėje chemijoje neempyriniai eletroninių molekulių stuktūrų paskaičiavimai reikalauja skaičiavimo išteklių, proporcinių N^4 arba И^5, kur N sąlyginai nurodo molekulės dydį. Šiuo metu molekulinės sistemos tirinėjamos supaprastintuose modeliniuose vaizdavimuose. Turint atsargoje dar didesnes molekulių biologines sistemas ar klasterius, kvantinė chemija duoda pavyzdinių priedų, esančių „potencialiai begaliniu“ superkompiuterių rezervų naudotojams. Yra dar viena superESM panaudojimo preoblema, apie kurią vertėtų užsiminti – tai duomenų vizualizacija, gautų atlikus paskaičiavimus. Dažnai, pavyzdžiui, sprendžiant diferencialines lygtis tinkliniu metodu, yra susiduriama su daugybe rezultatų, kuriuos žmogus skaitinei formoj tiesiog negali apdoroti. Tuomet būtina naudotis grafiniu duomenų vaizdavimu. Bet kokiu atveju iškyla informacijos transportavimo uždavinys kompiuteriniuose tinkluose. Šių problemų sprendimams paskutiniu metu yra skiriama daug dėmesio. Žymus JAV Nacionalinis superkompiuterių taikymų centras (NCSA) kartu su kompanija Silicon Graphics vykdo programos ,,ateities superkompiuteriai“ darbus. Šis projektas siūlo integruoti superkompiuterio POWER CHALLENGE galimybes ir kompanijos SGI vizualizacijos priemones su informacinių supermagistralių priemonėmis. Turėdama sukaupusi dar daugiau stambių molekulinių darinių (biologines sitemas, klasterius ir t. t.), kvantinė chemija yra ,,begalinio“ superkompiuterių na…udotojo pavyzdys.Apibendrinimas

Šiandien superkompiuterių pasaulyje pastebima nauja banga, sukelta tiek sėkmių mikroprocesorinių technologijų srityje, tiek ir naujų užduočių atsiradimo, išeinančių iš tradicinių mokslo-tyrimų laboratorijų ribų. Pastebimas greitas RISC-architektūros mikroprocesorių gaminimo tobulėjimas, kuris auga daug greičiau nei vektorinių procesorių gamyba. Pavyzdžiui, mikroprocesorius HP РА-8000 apytikriai dvigubai atsilieka nuo Cray T90, todėl artimiausiu metu ir toliau vektoriniai superESM gali būti išstūmiami RISC-mikroprocesorinių kompiuterių, tokių kaip IBM SP2, Convex/HP SPP, DEC AlphaServer 8400, SGI POWER CHALENGE. Tai patvirtino ТОР500 [4] reitingo rezultatai, kur pagal instaliacijų skaičių lyderiais tapo POWER CHALLENGE ir SP2 sistemos, aplenkiančios pirmaujančio superkompiuterių gamintojo, kompanijos Cray Research, modelius. Nors vektorinių superESM paklausa mažėja, tačiau ir toliau tęsis naujų vektorinių superESM vystymasis, tobulinimas Cray Research firmos. Turbūt vystymasis pradeda mažėti dėl reikalavimų būti suderintais su senais modeliais. Taip nesurado vartotojo kompanijos Cray Computer Cray-4 sistema, turinti konfigūracijos ir našumo charakteristikas, artimas naujoms Cray Research sistemoms Cray T90, kurios yra dukart pigesnės, tačiau yra nesuderinama su Cray Research kompiuteriais, todėl Cray Computer bankrutavo. Sėkmingai vystosi MPP-architektūros sistemos, tarp jų ir su paskirstyta atmintimi. Naujų didelio našumo mikroprocesorių atsiradimas, naudojančių pigią KMOP9-technologiją, iš pagrindų padidina šių sistemų konkurencingumą, todėl galima tvirtai teigti, kad per artimiausius du metus RISC-procesoriams nėra ko bijoti.

Naudota literatūra1. Cluster. Iš Supercomputers [interaktyvus]. [žiūrėta 2003 m. balandžio 25 d.]. Priega per internetą: 2. DRAM atmintis. Iš Kompiuterio atminties įtaisai [interaktyvus]. [žiūrėta 2003 m. balandžio 25 d.]. Priega per internetą; 3. Flinn I. IEEE Transnational Computing. London: Presscard, 1972. 948-960 p. ISBN 5-7900-0940-94. Pasaulio galingiausių kompiuterinių sistemų Top-500. Iš Didžiosios kompiuterinės sistemos [interaktyvus]. [žiūrėta 2003 m. balandžio 25 d.]. Priega per internetą:< http://www.top500.org.html/>

5. Борисов М. UNIX-кластеры. Iš Открытые системы [interaktyvus]. 1995, Nr. 2. [žiūrėta 2003 m. balandžio 3 d.], p. 22-28. Priega per internetą: 6. Волков Д. Как оценить рабочую станцию. Iš Открытые системы [interaktyvus]. 1994, Nr. 2. [žiūrėta 2003 m. balandžio 3 d.], p. 44-48. Priega per internetą: 7. Французов Д. Тест оценки производительности суперкомпьютеров. Iš Открытые системы [interaktyvus]. 1995, Nr. 6. [žiūrėta 2003 m. balandžio 16 d.]. Priega per internetą: 8. Кузьминский М. Процессор РА-8000. Iš Открытые системы [interaktyvus]. 1995, Nr. 5. [žiūrėta 2003 m. balandžio 16 d.] Priega per internetą: 9. Шнитман В. Системы Exemplar SPP1200. Iš Открытые системы [interaktyvus]. 1995, Nr. 6. [žiūrėta 2003 m. balandžio 3 d.]. Priega per internetą: