HPE supercomputer werkt nog steeds na 340 dagen in de ruimte

Bijna een jaar geleden lanceerde HPE een compacte supercomputer naar het International Space Station (ISS). Na 340 dagen draait de supercomputer nog steeds optimaal, ondanks de radioactieve straling in de ruimte en gebrek aan zwaartekracht.

NASA was benieuwd of een computer een jaar zou blijven werken in de ruimte, ongeveer de tijd om tot Mars te reizen. Het contacteerde daarvoor HPE en de Spaceborne Computer werd een feit. Het gaat zeker niet om de krachtigste machine, 1 teraflop, maar het is genoeg voor een indicatie. De hardware bestaat uit twee HPE Apollo Intel x86-servers met een 56 Gbps interconnect en Red Hat Enterprise Linux.

Veel benchmarks

“De supercomputer is nu al 340 dagen actief in de ruimte,” zegt Mark Fernandez, HPC Technology Officer bij HP in de VS en co-directeur van het ruimteproject. Hij laat aan The Register weten dat de machine geen specifieke stralingsbescherming heeft en dat het ook niet gebruikt wordt voor dagelijkse taken om astronauten in het ISS te helpen.

 

De supercomputer doorloopt continu een set van benchmarktesten om diverse componenten te testen.

 

In feite doorloopt de supercomputer continu een set van benchmarktesten om de interconnect, opslag, CPU en geheugencomponenten te testen. Het doel is om te weten wanneer een computer eigenlijk breekt in de ruimte zonder radioactieve stralingsbescherming.

Het systeem maakt volgens Fernandez gebruik van enkele softwaretrucjes om fouten te voorkomen. Er worden continu gezondheidschecks uitgevoerd om tijdig te detecteren wanneer er potentiële hardwarefouten zijn. Vanaf dan schakelt het systeem over naar een zwakkere benchmarksuite. Of het zet zich in slaapstand om daarna af te sluiten.

Slechte SSD’s

“Snel presteren is beter dan traag presteren,” zegt Fernandez aan The Register. “Traag presteren is beter dan helemaal uitschakelen. Maar uitschakelen is altijd beter dan iets stuk maken.” Er zijn maar twee momenten geweest dat de supercomputer zich helemaal heeft moeten uitschakelen.

Eén keer toen het rookalarm foutief werd ingeschakeld, waardoor automatisch alle stroom afsluit voor veiligheidsredenen. De tweede keer kwam door een astronaut die per ongeluk een foutieve stroomschakelaar bediende terwijl hij materiaal uit de SpaceX Dragon-capsule haalde.

 

Het zijn vooral de SSD’s die alarmerend snel falen zonder scherming tegen ruimtestraling.

 

“De meest voorkomende fouten zijn niet-permanent en rekenkundig van aard. Voeding, geheugen en CPU-cache hebben hiervan het meeste last, veel meer vergeleken met hardware op aarde,” zegt Hernandez. “De interconnect is prima, maar het zijn vooral de SSD’s die alarmerend snel falen in de ruimte.”

HPE overweegt om SSD’s toch te beschermen tegen ruimtestraling in de toekomst, mocht het opnieuw zo’n experiment doen in een latere ruimtemissie. Het is wel prettig om te weten dat na 340 dagen de supercomputer nog steeds optimaal presteert in de ruimte zonder nood aan een speciale behandeling tegen ruimtestraling.

Fernandez: “We weten nu dat we sowieso tot Mars kunnen geraken met onze hardware. Of we ook nog terug geraken met werkende hardware, valt nog af te wachten hoe deze test evolueert.”