Presentation
SSF Dataanalys / maskininlärning

SSF banar väg för konkurrenskraftig dataanalys

Publicerad 12 juni 2024
Foto: Fredrik Hjerling
Seif Haridi, professor i datorsystem, specialiserad på parallell och distribuerad datoranvändning samt chef för Distributed Computing Group vid KTH. Foto: Fredrik Hjerling
Seif Haridi, professor i datorsystem, specialiserad på parallell och distribuerad datoranvändning samt chef för Distributed Computing Group vid KTH. Foto: Fredrik Hjerling

Varje år ger SSF hundratals miljoner kronor i stöd till forskning med betydelse för Sveriges framtida konkurrenskraft. Ett framgångsexempel är Seif Haridis två projekt inom dataanalys och maskininlärning. Projekt som gett open source-system, direkta kommersiella tillämpningar och en etablerad grund för vidare kunskapsutveckling.

Seif Haridi är professor i datorsystem, specialiserad på parallell och distribuerad datoranvändning samt chef för Distributed Computing Group vid KTH. Sedan 2012 har han lett två SSF-finansierade projekt som rönt stora framgångar inom datahantering och dataanalys.
– SSF:s bidrag – en betydande summa pengar – har hjälpt oss att skapa en kritisk massa som gett väldigt givande projekt. Den industriella tillämpningen av våra tekniska framsteg och alla studenter vi utbildat – många som idag är professorer i andra länder och universitet – talar sitt tydliga språk. Utan SFF hade det aldrig hänt, säger Seif Haridi.
Hans första projekt End-to-End Distribuerade Moln startade 2012 och har utvecklat system och infrastruktur för beräknings-, lagrings- och kommunikationskrävande tillämpningar och tjänster. Arbetet har resulterat i tekniska innovationer och gett upphov till nya utbildningar, doktorander och företag. Särskilt anmärkningsvärd är kanske Hopsworks, den första kompletta europeiska plattformen för dataanalys och maskininlärning. Det gäller även projektets bidrag till designen av Apache Flink som idag används globalt av företag som Uber, Netflix, Alibaba och King. Därtill har projektet lett till ett nytt masterprogram i datasystemvetenskap vid KTH och två Massive Open Online Courses (MOOC). På den kommersiella fronten har projektet mynnat ut i start up-företaget Hopsworks med kunder som Karolinska Institutet, Scania och Ericsson.

Ekosystem av innovationer
2017 tog Seif Haridi tillsammans med Paris Carbone kunskapen från End-to-End vidare i projektet Kontinuerlig Djup Analys. I ett samarbete mellan KTH och RISE utvecklade projektet system för realtidsanalyser och ett nytt programspråk för datadriven workflow. Det har gett betydande framsteg och förbättrad tillförlitlighet och tolkningsbarhet av maskininlärningsmodeller och analys av strömmade data. Liksom sin föregångare har projektet betydande tekniska, industriella och kommersiella framgångar. Här kan nämnas system och verktyg som OmniPaxos och AquaLang som ger sömlös integration av olika analyssystem, samt Orb DB, en ny databas för grafanalys och generativ AI.
– 2012 var vi tidiga med vår forskning. Idag ser vi att den banat väg för ett ekosystem av innovationer som bryggar över forskning, industriella utmaningar och samhälleliga behov. SSF, med dess positionering mellan grundforskning och tillämpbara resultat, har varit en otrolig viktig del av den utvecklingen, säger Seif Haridi.

Stiftelsen för strategisk forskning – Dataanalys / maskininlärning

End-to-End Distribuerade Moln drevs av KTH 2012–2018 med stöd från SSF på 25 miljoner kr. Resulterade bl.a. i nytt masterprogram i Systems for Data Science samt tekniska industriella och kommersiella framgångar som Hopsworks och Apache Flink.
Kontinuerlig Djup Analys drevs av KTH och RISE 2017–2022 med stöd från SSF på drygt 32 miljoner kr. Resulterade bl.a. i mjukvaru- och systembidrag som OmniPaxos, μWheel, AquaLang och Orb DB.

strategiska.se