Chris Schwiegelshohn

Forskningsleder

 

Projekttitel

Algorithmic Challenges of Big Data

Hvad handler dit projekt om?

En stor del af den seneste udvikling inden for videnskaben er drevet af vores evne til at udføre komplekse dataanalyseopgaver. I dag arbejdes der ikke længere med små mængder data fra et enkelt laboratorie, men derimod med meget store datasæt samlet ind fra forskellige steder i verden. Denne ændring rejser spørgsmålet om skalerbarhed: Hvordan opbevarer vi data? Hvordan får vi den relevante information ud af data? Hvordan deler vi informationen? Sådanne spørgsmål har haft stor fokus i datalogi og maskinlæring. Og selvom dette aktive forskningsfelt allerede har mange succeshistorier, er vi kun lige begyndt. Mange klassiske problemer er endnu ikke løst, mens nye spørgsmål om algoritmers retfærdighed, privatliv, eller determinisme, først for nylig har fået opmærksomhed. Dette projekt beskæftiger sig med udfordringerne ved at udføre moderne dataanalyse i stor målestok.

Hvordan opstod din interesse for dit forskningsfelt?

Jeg har altid interesseret mig for matematik og som barn var jeg meget begejstret for Asimovs serie om Stiftelsen. Det var ikke direkte årsagen til, at jeg begyndte at arbejde inden for området, men måske har det alligevel påvirket mine valg, for nu arbejder jeg i et område, der handler om at udvikle matematiske modeller og værktøjer til analyse af menneskelig adfærd. Med andre ord er jeg med til at realisere Stiftelsen. Gider ikke tv-serien.

Hvad er de forskningsmæssige udfordringer og perspektiver ved dit projekt?

Nogle af de problemer jeg arbejder med er som udgangspunkt svære. Det kræver en blanding af udholdenhed, viden, og held for langsomt at kunne belyse de store problemstillinger inden for området. Så er næste skridt at finde ud af om vi har det nødvendige matematiske værktøj eller der er brug for ny indsigt. For andre problemstillinger, såsom dem der udspringer af etiske overvejelser, er udfordringen at vi ikke rigtig ved hvilke problemer vi skal tage fat i. For eksempel: Stort set alle er enige om, at en algoritme bør være retfærdig, men der er stor uenighed om, hvad den præcise definition af retfærdighed bør være. Udfordringen lige nu er ikke kun at skulle løse et svært problem, men derimod at forstå og håndtere de meget forskellige ideer om, i hvilken retning dette forskningsområde bør bevæge sig.

Hvilke perspektiver vurderer du selv, at din forskning på sigt kan have for det omgivende samfund?

Til en vis grad er teoretisk arbejde med algoritmer et felt, der er opstået på baggrund af et behov inden for andre områder. Heldigvis for mig har området i dag i høj grad etableret sig som et selvstændigt område. Vigtigheden af dataanalyse bliver ikke mindre, og nogle af de algoritmer, som vi arbejder med at forstå bedre, bliver allerede brugt i stor stil. At forbedre, eller bare at forstå disse algoritmer bedre, har direkte indflydelse på mange aspekter af samfundet. I det lange løb håber jeg, at det arbejde vi lægger i at gøre dataanalyse skalerbar, vil blive en grundlæggende komponent i alle maskinlæringsbiblioteker. Før jeg går på pension vil jeg gerne se nogen bevise ’an optimal coreset algorithm for Euclidean k-means’. Jeg vil ønske denne ‘nogen’ bliver mig, men på nuværende tidspunkt er jeg ikke så kræsen.

Hvad vil det betyde for din forskerkarriere, at du indgår i Sapere Aude-programmet?

På kort sigt, vil Sapere Aude programmet hjælpe til at tiltrække dygtige ph.d.-studerende og postdocs til at hjælpe mig med at løse de mest spændende åbne problemstillinger i analyse inden for big data. På længere sigt vil Sapere Aude-bevillingen bidrage til at etablere en stærk forskningsgruppe inden for maskinlæring på Aarhus Universitet.

Lidt om mennesket bag forskeren

Jeg er opvokset i USA og senere Tyskland. Efter min ph.d. har jeg arbejdet på Sapienza University i Rom, hvilket har været en fantastisk oplevelse. Alligevel var jeg glad for at få muligheden for at komme til Aarhus, hvor jeg er nu. Udover algoritmer er jeg vild med italiensk mad, at løbe, NBA og heavy metal.