NSC bygger vidare

En eller två processorer?

Läs om hur vi använder FastEthernet och lyckas skrämma upp 24 PC-burkar till 10 GFlops.

DET byggs på NSC som aldrig förr. I artikeln PC-kluster - ett alternativ? i nummer 5 av Nytt från NSC berattade vi hur vi förra sommaren byggde vårt första PC-kluster på NSC. Den här sommaren har vi byggt ytterligare ett PC-kluster och nu i dagarna är det tredje klustret redan på väg att levereras.

Byggandet av PC-kluster denna sommar har skett i samarbete med SKF. SKF har utvecklat ett programpaket för kullagersimuleringar som fungerar bra i klustermiljö. Programmet har rullat(!) i ett år nu på Banan, vårt första kluster, och behöver nu mer beräkningskapacitet allteftersom komplexiteten på modellerna ökar.

Klustret heter Alice och består av 25 stycken AMD Athlon-processorer som klockas i 700 MHz. Det finns fortfarande inga moderkort för processorer från AMD som klarar av mer än en processor så därför sitter varje processor is sin egen PC-låda, har sin egen disk, sitt eget nätaggregat, sitt eget minne och sitt eget nätverkskort. När man tittar på prestanda visar sig den här konfigurationen vara lyckosam. Eftersom processorn inte behöver konkurrera med någon annan för att komma åt varken minne eller nätverk är detta kluster betydligt snabbare än det första vi byggde (banan). Naturligtvis spelar också valet av processor och den ökade klockfrekvens en viss roll.


Datorkluster bör vara homogena.

Det kan tyckas att en lösning där två processorer delar på resurserna bör bli billigare men det är inte fallet här. Ett bra moderkort för två processorer kan vara dyrare än vad en extra låda, nätaggregat, disk, nätverkskort och ett extra moderkort kostar. Tar man dessutom med prestandan i bilden, är datorer med endast en processor per låda klart mera prisvärda. Detta gäller så länge som vi håller oss till ungefär de komponenter vi valt ovan. Tittar vi på andra lösningar, t.ex. snabbare nätverk blir ekvationen annorlunda.

Ett annat argument för två-processors datorer som ofta dyker upp är de högre lokala kommunikationshastigheterna som erhålls så länge man stannar innanför lådans väggar. Det må vara sant men applikationer som drar nytta av denna fördel och är optimerade för denna arkitektur är få till antalet om det överhuvutaget finns några. Portabilitet är en mycket viktigare faktor hos programvara idag vilket gör att datorer och datorkluster bör vara så homogena som möjligt.

Självklart ville vi mäta hur snabb Alice blev innan vi införlivade den i produktionen. Med LINPACK (SLbench från www.netlib.org) mätte vi upp 10024 MFlops på 24 av Alice' 25 processorer när vi faktoriserar en matris på 26000 x 26000 element. (jmfr: 4000 GFlops på alla 20 Banan-processorerna). Och detta utan att modifiera en enda källkodsrad. Det bör noteras att vi fortfarande bara använder FastEthernet (100 Mbit/s) för den interna kommunikationen i klustret.

Utgående från de erfarenheter vi fått, bygger vi nu ett PC-kluster för NSCs användare. Klustret kommer att integreras i NSCs produktionsmiljö och vara tillgängligt för forskare i Sverige på samma sätt som de större maskinerna, T3E och SGI2000.

Athlon blir grundstenen även i detta, NSCs tredje, PC-kluster. Intel har ju inte lyckats producera något bra chipset sen det nu mångåriga 440BX-chipet. Athlon-processorn i Alice visade sig vara snabb på flyttalsberäkningar. Dessutom fungerar den bra tillsammans med VIAs chipset. Vi använder dock en nyare variant av processorn, Thunderbird, där andranivås-cachen har visserligen halverats men istället integrerats på processorchipet. Klockfrekvensen blir 900 MHz och antalet processorer minst 33 st. Till en början använder vi FastEthernet även i detta kluster men planer finns att införskaffa och implementera ett betydligt snabbare nätverk. Läs mer om detta i nästa nummer av "Nytt från NSC".

Niclas Andersson
NSC

FAKTARUTA

Klustret Alice innehåller 25 stycken AMD Athlon processorer med klockfrekvens 700 MHz. Processorerna är av Slot A-typ och är monterade på moderkort från ASUS (K7V) som har ett KX133-chipset från VIA. Varje dator har 256 Mbyte minne (PC133 SDRAM) och alla datorerna är sammankopplade med FastEthernet (Intel Pro/100+) till en ProCurve-switch från Hewlett-Packard förutom en dator (FrontEnd) som har en Gigabit Ethernet-förbindelse till switchen. I FrontEnd har extra disk installerats. Datorerna är levererade av Advanced Computing Technology (ACT) i Linköping. Alltsammans är inhyst i en tre-sektioners IVAR-hylla från IKEA. Med extra kryss-stag! Operativsystemet är RedHat 6.2 med Linux-kärnan uppgraderad till 2.2.16. För mer information se http://www.nsc.liu.se/alice/.

NSCs "byggnadsarbetare" denna sommar var
  • Carl Lejdfors,
  • Peter Kjellström,
  • Anders Rönnbrant och
  • Niclas Andersson.
  • Datorerna levererades av
    Advanced Computer Technology AB.


    Vi vill gärna komma i kontakt med användare som vill testa, utvärdera och använda NSCs kluster. Vi söker i första hand användare som har egen kod som redan är parallelliserad och som använder MPI (helst) eller PVM för kommunikationen. Så om du har ett program som du vet eller tror kan utnyttja denna arkitektur effektivt, hör av dig till NSC (<nsc@nsc.liu.se>).


    Niclas Andersson
    Last modified: Sun Sep 24 14:57:15 CEST 2000