Presentation
CDA Realtidsintelligens

Dataanalys i realtid för framtidens smarta lösningar

Publicerad 16 juni 2021
Foto: Johan Marklund
Paris Carbone, senior forskare och ansvarig för projektet vid RISE och Seif Haridi, professor i datorsystem vid KTH. Foto: Johan Marklund
Paris Carbone, senior forskare och ansvarig för projektet vid RISE och Seif Haridi, professor i datorsystem vid KTH. Foto: Johan Marklund

Digitaliseringen sker med hisnande fart och kräver helt nya lösningar för att vi i realtid ska kunna analysera data och fatta beslut. Forskare på KTH och RISE samverkar för att ta fram banbrytande nya datasystem och programspråk, som möjliggör det smarta samhället.

Det digitala samhället, där ofattbart stora mängder data genereras från sensorer och andra enheter, ger helt nya möjligheter att skapa intelligenta lösningar. Det kan exempelvis gälla för trafik- och samhällsplanering, smarta bostäder eller kritiska affärsbeslut. Idag drivs utvecklingen av detta inte minst av utbyggnaden av 5G, som möjliggör sakernas internet (IoT). Men data åldras snabbt och gammal data duger inte som kunskapsstöd eller som underlag för tidskritiska beslut. Dagens teknologi, där data samlas i stora datacentra och moln, ger retrospektiva svar som inte möter morgondagens behov av realtidslösningar. Idag finns dessutom ett brokigt lapptäcke av lösningar, med olika koder och programspråk, som inte harmoniserar.
I det stora forskningsprojektet Kontinuerlig Djup Analys, CDA, arbetar ett team tvärdisciplinära forskare och doktorander från KTH och RISE (Research Institutes of Sweden) med att ta fram teknologi i den absoluta framkanten för att adressera denna utmaning. Arbetet spänner över ett brett spektrum av datavetenskap och ingenjörsvetenskap och omfattar såväl grundforskning som tillämpad forskning.

Blixtsnabb analys
Fokus ligger på att utveckla ett nytt programvarusystem, som är robust, energieffektivt, skalbart och datadrivet för nästa generations mjukvaruplattformar. Genom systemet kan data analyseras och bearbetas blixtsnabbt i realtid, samtidigt som den strömmas.
– Vi skapar programspråk för datadriven ”work-flow”, där vi kan sända frågor och få svar och kunskap om verkligheten i realtid. På så sätt kan vi göra omedelbara förutsägelser eller fatta beslut, förklarar Paris Carbone, senior forskare och ansvarig för projektet vid RISE.
Forskningen svarar väl mot ”sky computing”, som är en av de stora trenderna inom datavetenskap. I denna samverkar resurserna från jättelika molncentra i en storskalig, distribuerad infrastruktur, med programmeringsspråk som har fokus på vad som ska göras, snarare än på hur det ska göras.
– Vi har en helt annan IT-infrastruktur idag jämfört med tidigare. Informationen finns inte längre i varje separat enhet, exempelvis en PC. Istället utgör de olika små enheterna fönster till stora, distribuerade molnsystem som de är integrerade delar av. För att effektivt utnyttja de stora molnsystemens enorma datamängder måste programspråk och teknologi anpassas, förklarar projektledare Seif Haridi, som är professor i datorsystem vid KTH.

Goda resultat hittills
Projektet startade 2017 och har kommit drygt halvvägs. Pandemin har inneburit ett avbräck för internationella anställningar och samarbeten, men nu börjar dessa åter komma igång. Seif Haridi och Paris Carbone är mycket nöjda med resultaten hittills. Forskarna har utvecklat system med enkelt gränssnitt som passar för olika typer av befintlig hårdvara och byggt bibliotek där komplex data lagras i form av kunskapsgrafer eller maskininlärningsmodeller för realtidsbearbetning. Det finns planer på samverkan med flera företag, bland annat Luftfartsverket, som visat intresse för att tillämpa teknologin för att övervaka och styra flygtrafik. Andra tillämpningar är att styra trafik på våra vägar, snabbt upptäcka cyberattacker eller för att göra förutsägelser om olika typer av biomarkörer inom livsvetenskaperna. Dynamisk prissättning och energieffektivisering är ytterligare exempel på möjliga användningsområden.
– Vi arbetar med ena foten i framtiden och vet ännu inte alla potentiella tillämpningar som den här teknologin kan få. Men för att kunna ta steget in i morgondagens genomdigitaliserade samhälle, med alla de möjligheter som det innebär, är innovativa, hållbara modeller och system för dataanalys i realtid helt nödvändiga, säger Seif Haridi.
CDA finansieras av Stiftelsen för strategisk forskning, SSF, inom ramen för programmet Big data och beräkningsvetenskap. Det är ett område som SSF identifierat som strategiskt viktigt där Sverige har goda förutsättningar att ta en ledande roll.

KTH – CDA realtidsintelligens

Projektet CDA finansieras av Stiftelsen för strategisk forskning, SSF, och är ett forskningssamarbete mellan KTH och RISE, för att skapa framtidens lösningar för att analysera data i realtid. CDA är en fortsättning på ett tidigare forskningsprojekt där Seif Haridi och hans team utvecklade öppenkällkod-programvara, Apache-Flink, för analys av strömmande data, samt Hopsworks, som är den första kompletta europeiska plattformen för dataanalys och maskininlärning. Apache-Flink har kommersialiserats och används av flera ledande aktörer, bland annat taxitjänstföretagen Uber och Lyft. Hopsworks har lett till ett svenskt spinn-off, logicalclocks.com.
Stiftelsen för strategisk forskning finansierar excellent forskning inom naturvetenskap, teknik och medicin som har strategisk relevans för svensk konkurrenskraft. Prioriterade områden är Informations-, kommunikations- och systemteknologier (ICT), Livsvetenskap samt Materialforskning.

cda-group.github.io