SciLifeLab tar stora kliv mot att bygga en ny typ av nationell e-infrastruktur för livsvetenskaperna. Fokus ligger nu på data och forskningsnära användning, och att utnyttja nya starka resurser för beräkning och lagring för forskningsdatatjänster.
SciLifeLab är en central pusselbit i forskning inom livsvetenskaperna i Sverige. Sedan 2014 har SciLifeLab drivit nationell infrastruktur som bistår svenska forskare med avancerade instrument, tekniska experter och forskningsdatatjänster. Målet är att förverkliga forskning som annars inte skulle vara möjlig.
– Det är en väldigt bra deal för svensk forskning, säger Johan Rung, chef för SciLifeLab Data Centre, en enhet som utvecklar och driver nationella datatjänster och digital infrastruktur.
SciLifeLab producerar mycket stora mängder data från sina teknologiplattformar. Varje år genereras cirka 20 petabyte forskningsdata av många olika typer. För att sätta det i perspektiv motsvarar det cirka 40 miljoner timmar streamad musik i hög kvalitet, eller 4500 års oavbruten lyssning!
– Och nästa år är det ju ännu mer som genereras, och året därpå ännu mycket mer. Så vi behöver hela tiden springa för att hålla samma tempo som utvecklingen, förklarar Jonas Svensson, ansvarig för it-system och infrastruktur vid SciLifeLab Data Centre.
Därför utvecklar och driver SciLifeLab Data Centre ett ekosystem med beräknings- och lagringstjänster, forskningsdatabaser, AI-tjänster, mjukvaruutveckling och annat.
Lego för forskare
Ofta läggs ett stort fokus på den snabbt växande kapaciteten vid svensk e-infrastruktur. Men i takt med att forskningen blir alltmer teknikintensiv och datadriven ställs ökande krav på exakt hur dessa resurser kan användas på olika sätt inom forskningsprojekten.
För att verkligen utnyttja kraften hos de nya superdatorerna krävs mer än bara tillgång till basnivån på systemet.
– Det behövs ny digital infrastruktur i ett mellanlager där beräkningsapplikationer, databaser och AI-modeller kan sättas i arbete på ett sätt som är skalbart och går att flytta mellan olika beräkningsmiljöer, säger Johan Rung.
Vid SciLifeLab Data Centre har därför en plattform utvecklats för detta. Den baseras på Kubernetes – en teknologi för att driftsätta applikationer, verktyg och datatjänster med så kallade containrar ovanpå en skalbar e-infrastruktur. Den ska nu göra avancerade beräknings- och lagringsresurser mer tillgängliga för forskare.
Systemutvecklaren Quentin Ågren förklarar det med en metafor:
– Man kan säga att den fungerar som en legoplatta som forskarna kan knäppa fast sina applikationer på som legobitar. Den blir både lätt för forskarna att använda och för oss att felsöka och bygga ytterligare tjänster på, säger han.
Delning och säkerhet i balans
Att infrastrukturen får allt fler användare innebär också krav på datasäkerhet. SciLifeLab arbetar därför utifrån principen ”så öppet som möjligt, så stängt som nödvändigt”.
I sammanhanget är det mycket tryggt att använda sig av en globalt väletablerad plattform.
– I och med att vi använder en standard som många andra i världen använder är den granskad väldigt noga, sårbarheter får mycket uppmärksamhet och communityt kommer med lösningar som vi kan patcha väldigt snabbt, säger Quentin Ågren.
SciLifeLab är idag ett nätverk av personal och enheter på universitet runt om i Sverige. Vid SciLifeLab Data Centre skapas nu en gemensam grund som gör det möjligt att arbeta med samma plattform oavsett om forskaren sitter i Lund eller Umeå.
Från artikel till applikation
SciLifeLab Data Centre underlättar dessutom det viktiga skiftet från textpublicering till bredare tillgängliggörande av forskningsresultat. Inom forskarvärlden blir det nämligen allt vanligare att forskning resulterar i olika digitala resurser snarare än enbart artiklar.
– Tidigare slutade forskningen i en artikel eller en PDF. Idag handlar det inte bara om PDF:er, utan om databaser, AI-modeller eller metoder som man har utvecklat. Den här plattformen gör det möjligt att återanvända sådana resurser, säger Johan Rung.
Det nationella initiativet är ett svar på att livsvetenskapens datamängder växer i rasande takt. Med verktyg som SciLifeLab Serve – en plattform för att driva och dela forskningsapplikationer – har SciLifeLab redan samlat över 200 olika svenska forskningsprojekt under ett och samma tekniska tak. Och det är bara början.
SciLifeLab Data Centre är en nationell infrastruktur för data från livsvetenskaperna. Enheten arbetar med att tillgängliggöra data från svensk forskning för att samtidigt skapa ett brett forskningsgenomslag och möta kraven kring delning av hälsodata och datatunga nya tekniker. Inom ramen för satsningen kombineras it-expertis med forskningsdatastöd när SciLifeLab Data Centre bygger en nationell dataplattform för forskning och infrastruktur.
Initiativet uppbär finansiering från Stiftelsen för strategisk forskning, SSF, med 15 miljoner kronor till Johan Rung som Research Infrastructure Fellow. Projektet pågår mellan 2022 och 2027.
data.scilifelab.se