KARE: Robust Exploratory Search in Large Knowledge Graphs
I en forbundet verden af individer og systemer, er forbindelser det nødvendige instrument til at forstå komplekse fænomener som fx sygdomsspredning. Disse forbindelser danner store netværk, kendt som ”Knowledge Graphs”. Sådanne ”Knowledge Graphs” kræver komplicerede analyser, som intelligent gennemtrawler netværket og producerer meningsfulde forbindelser. Imidlertid er fageksperter inden for fx sundhed eller samfund typisk ikke dataanalytikere eller har stor viden om brug af data. Konsekvensen er, at fageksperterne ofte anvender en eksplorativ tilgang til at undersøge data, som resulterer i vage søgetermer, der giver utilfredsstillende svar og kræver flere forsøg for at opnå brugbare resultater. Denne ”søg-og-justér” tilgang vanskeliggør hurtige opdagelser, i en tid hvor hastighed er afgørende. Yderligere kan søgemekanismen levere fejlbehæftede svar pga. fejl i data. Dette projekt undersøger både vagheden og fejl i eksplorativ søgning og foreslår i stedet robuste metoder, som ikke påvirkes af fejl i data. For at opnå robusthed, er det brugeren, der tilvejebringer viden, der guider intelligente algoritmer til det det rigtige svar. Projektet vil frembringe algoritmiske metoder til eksplorativ analyse af store netværk, som tilpasser sig til søgninger og brugerens upræcision, og er robust i forhold til fejl i sådanne netværk.
Jeg har altid være fascineret af tanken om, at computer en dag ville kunne hjælpe mennesker med at besvare deres spørgsmål. Efter jeg så de første søgemaskiner og smart-home-assistenter besvare simple spørgsmål ved at bruge intelligente algoritmer, besluttede jeg mig for at undersøge, hvordan man kunne gøre information lettere tilgængelig for alle, uanset om man er ekspert eller ej. Den interesse driver fortsat min forskning.
To store mangler i aktuel forskning af "graf søgning” er en forhindring for let undersøgelse af data: Problemet med upræcise søgninger og søgemekanismens sårbarhed overfor fejl i data. Dette betyder brugeren enten skal ændre data eller i søgningen manuelt for at finde de svar der søges efter, hvilket forsinker nye opdagelser. Dette projekt foreslår den første robuste undersøgelse af ”large knowledge graphs” (forstået som robust overfor fejl). Resultatet af mit projekt er ”modificerings algoritmer” som hjælper brugeren i søgeprocessen og ”oprydnings” algoritmer som begrænser støj og fejl i data. Disse algoritmer kommer til at drive smart-home- assistenter og specialiserede søgemaskiner som kan hjælpe brugeren med at finde de rette informationer.
Smart-home-devices og specialiserede søgemaskiner er afgørende for at kunne søge i og kategorisere kompleks information. KARE projektet vil hjælpe alle med at få adgang til den information ved at give det rigtige svar og hjælpe brugeren i selve søgningen. Mit projekt har stort potentiale for at begrænse spredningen af misinformation og for at accelerere forskning i kritiske områder som virologi, fysik, energi osv., hvor hastighed kan være udslagsgivende for succes.
Dette projekt er højdepunktet i mange års arbejde i graf analyse, en disciplin som kræver samarbejde med relaterede områder som databaser, data mining og maskinlæring. Det foreslåede projekt vil udvikle mig som selvstændig forsker og leder i graf analyse, og give grobund for flere tværfaglige samarbejder. Derudover til adgang til knowledge graphs vil bekæmpe misinformation til gavn for forskning og for samfundet.
Jeg kommer fra Marostica, en lille landsby i Norditalien ved foden af Alperne. Jeg flyttede til Trento for at færdiggøre mine studier og min ph.d. derefter. Jeg tilbragte 3 år i Berlin som post doc. I 2018 flyttede jeg til Aarhus og blev ansat på Institut for Datalogi, Aarhus Universitet som tenure track adjunkt. Jeg synes godt om den særlige aarhusianske atmosfære af en lille by, men levende. I min fritid nyder jeg at være sammen med min kone, at lave mad, at hike og at svømme.
Aarhus Universitet
Databases, Data mining, Machine Learning
Aarhus
Liceo Scientifico Jacopo Da Ponte, Bassano del Grappa, Italy