De unikke danske administrative registre indeholder enorme mængder af data. Disse data har været uundværlige i medicinsk forskning. Denne forskning har ført til ny og betydningsfuld viden om en lang række sygdomme – en viden, som ofte er blevet offentliggjort i anerkendte internationale tidsskrifter. Sådanne registerdata antager en enorm størrelse, når de beriges med genetiske data. Denne enorme mængde data medfører, at gængse beregningsalgoritmer og statistiske metoder kommer til kort. Dette resulterer i, at væsentlig viden går tabt, og at det fulde potentiale af disse data ikke nyttiggøres. De danske iPSYCH data er et eksempel på et sådant komplekst datasæt, idet de består af registerdata beriget med genetiske data. Internationalt set er iPSYCH data enestående, da de giver mulighed for samtidigt at analysere genetiske og miljømæssige risikofaktorer for psykiske lidelser. I dette projekt vil vi udvikle nye statistiske modeller, der kan bearbejde adskillige typer af komplekse og dynamiske data, så som familiehistorie for sygdom og socioøkonomi, individuel sygdomshistorik, samt personens eget genom. Dermed udnyttes de exceptionelle danske data til fulde. Vi vil anvende disse modeller i iPSYCH data for at forstå de miljømæssige og genetiske årsager til psykiatriske lidelser. Dermed kan vi forudsige det enkelte individs sygdomsforløb.