Maskininlärning, eller engelskans Machine Learning, är i sig inget nytt begrepp. Däremot har dess användningsområden och frekvens ökat avsevärt under det senaste decenniet och numera appliceras maskininlärning på allt från självkörande bilar till filmrekommendationer. Men kan tekniken nyttjas för att skapa träffsäkrare analyser? Kristoffer började på vår utvecklingsavdelning under våren och innan dess skrev han sitt examensarbete inom datavetenskap om just huruvida maskininlärning kan bidra till träffsäkrare analyser.
Att träna datorer
Kristoffer, vad handlade ditt examensarbete om och vad kom du fram till?
– Det handlade om att, med hjälp av fem stycken olika maskininlärningsmodeller, försöka förutspå resultat och sedan värdera hur pass träffsäkra modellerna var samt hur de står sig mot INSIKT:s nuvarande modeller. Under arbetet lät vi modellerna tränas genom att titta på historiska data för att på så vis lära sig hur resultatet förändras över tid. Sedan lät vi modellerna förutspå framtida resultat och kunde då se ett något delat resultat där några modeller var klart sämre än de som idag kan hittas i INSIKT, men att det även fanns modeller med viss potential.
Maskininlärning handlar alltså om metoder som, genom kontinuerlig dataanalys, tränar upp datorer för att kunna lösa olika uppgifter. Det kan handla om allt från att lära en självkörande bil hur den ska agera i olika scenarier eller vilka filmer som streamingtjänsten ska föreslå just dig en fredagskväll i soffan.
Effektiva modeller
Hur fungerar de mer effektiva modellerna och varför stack de ut?
– Anledningen till att dessa modellers resultat stack ut var främst att de helt enkelt är mer avancerade. De är inte nödvändigtvis svårare att träna, men de innehåller mer avancerade funktioner tillskillnad från de något äldre och mer betrodda modellerna. Dessa metoder var främst Random Forest och Extreme Grade Boosting. Random Forest använder något som kallas för Bagging, vilket bygger på att en stor mängd enklare modeller tillsammans jobbar för att skapa en starkare modell. Extreme Grade Boosting är desto mer komplicerad och som inledningsvis använder en simpel modell, men sedan kontinuerligt tränas upp för att ständigt förbättra sig själv.
Ökad träffsäkerhet
Resultatet av modellernas effektiva analyser ses i ett mer träffsäkert resultat. I just detta fall handlade det om försäljning av snabbmat. Där kunde maskininlärningsmodellerna förbättra nuvarande estimat med ungefär 80 kronor per timme. Tar vi några steg tillbaka och ser på dygnets alla timmar, årets alla dagar och inte minst alla restauranger handlar det helt plötsligt om ganska avsevärda summor. Skalar man även upp det data som matas in i modellen möjliggör man samtidigt en ökad träffsäkerhet. Här blir tillgången till relevant data viktig och verksamheter som redan nu mäter sin verksamhet kommer ha stora fördelar under maskininlärningens framtåg. Detta går även helt i linje med det INSIKT som hjälper användare att göra redan nu – ta bättre beslut, styra sin verksamhet effektivare samt spara tid. Vi ser dock stora möjligheter att, med hjälp av maskininlärning, underlätta våra användares vardag än mer genom ökad automatisering av analysarbetet samt att låta tekniken åskådliggöra mönster som manuell analys inte skulle kunna hitta. På så vis kommer vi kunna ta redan existerande data till nya höjder.