För att kunna använda metoder som maskininlärning och djupa neurala nätverk behövs verkliga data för att träna modellerna, men att samla in och bereda all data är både kostsamt och ibland omöjligt. Därför behöver man komplettera med syntetiska data och få dem att efterlikna verkligheten så bra som möjligt.
Att hitta sätt att göra det på är en utmaning som industridoktoranden Joakim Lindén tagit sig an. Han jobbar på Saab som har behov av att hitta nya strukturerade sätt att få fram mer verifierade data som deras träningsmodeller använder.
– Prestandan från en tränad modell beror på vilken indata man använder. För att få modellerna att prestera i verkligheten måste alltid verkliga data användas. Min forskning handlar om att hitta sätt att kombinera verkliga data med syntetiska data som vi kan få fram genom simuleringar. Syftet är att kunna generera tillräckliga mängder representativa data så att exempelvis en maskininlärningsmodell kan bli tillförlitlig utan att det kostar för mycket tid och resurser.
Han tar exemplet med en modell som med sensordata hjälper flygplan navigera och landa säkert. För att den ska bli användbar måste sensordata insamlas vid olika tider på dygnet så att modellen lär sig känna igen saker i dagsljus, skymning och mörker.
– Man måste också samla in data vid olika årstider, olika väderlekar och så vidare, vilket kräver stora resurser och ibland kan vara helt omöjligt. Därför behöver vi kunna använda syntetiska data också, som går mycket snabbare att ta fram och vars förutsättningar/egenskaper vi har bättre kontroll över.
Kvalitetssäkra syntetiska data
Utmaningen handlar främst om att få den ”syntetiska världen” att överensstämma bättre med den verkliga.
– Det är kärnan i forskningen, att på en viss nivå kunna garantera att syntetiska data stämmer med verkligheten. Genom det kan man adressera många frågor inom maskininlärning som hittills varit omöjliga att hantera, förklarar professor Masoud Daneshtalab på Avdelningen för intelligenta framtida teknologier på Mälardalens universitet.
Han är handledare för Joakim Lindén och tillsammans ser de tre viktiga delar i projektet som behöver adresseras.
– Det första är att minska gapet mellan verkliga data och syntetiska, det andra är att med en strukturerad insamlingsprocess kunna säkerställa prestandan hos syntetiska data, vilket leder till det tredje som är att skapa robusta modeller som kan användas även i säkerhetskritiska system.
Stiftelsen för strategisk forskning satsar 30 miljoner kronor på SSF Industridoktorandprogram, ett av projekten som beviljats medel är ”Dependable AI in Safe Autonomous Systems” som är ett gemensamt projekt mellan Mälardalens universitet och SAAB.
mdu.se