RAD: Ressourcebevidst Data Science
RAD handler om at gøre data science opgaver, især træning af deep learning, mere hardware-bevidst. Traditionelt har den dominerende metrik, der skal optimeres til i kunstig intelligens, været nøjagtighed. Imidlertid er det beregningsmæssige fodaftryk for at nå et bestemt nøjagtighedspunkt meget overset. Derfor er der en markant stigning i behovet for hardware-ressourcer, når antallet af data science forskere, der udvikler kunstig intelligens modeller, øges. I RAD vil vi udvikle nye teknikker til at reducere data science forskernes hardwarebehov markant ved at gøre de typisk værktøjer, de bruger, mere hardware-bevidste.
Jeg kan godt lide at være i krydsfeltet mellem ting og bygge bro imellem så meget som muligt. Da jeg var ung ph.d.-studerende, besluttede jeg mig for, at jeg ville være i krydsfeltet mellem software og hardware i min forskning. Jeg besluttede mig for at fokusere på dataintensive systemer (databaser, big data-systemer, værktøjer til kunstig intelligens osv.), på grund af dennes store betydning i vores datadrevne samfund i dag. Det er rigtig vigtigt at udnytte moderne hardware-ressourcer så effektivt som muligt for at skabe bæredygtig vækst for dataintensive systemer og applikationer.
Den eksponentielle udvikling af hardware og bølgen af værktøjer til kunstig intelligens, der skjuler kompleksiteten af hardware, øger markant produktiviteten hos data science forskere i dag. Der er dog et voksende ydelsesgab mellem softwareværktøjerne og moderne hardware. Hovedudfordringen i dette projekt er at bygge bro imellem forskellige data science arbejdsbyrder ved at samarbejde omkring brug af hardware ressourcer og deling, mens man samtidigt fastholder produktiviteten hos data science forskere.
Mit projekt vil bidrage til at opnå en mere bæredygtig vækst inden for data science. Data science og kunstig intelligens er her for at blive og her for at vokse. Denne vækst bør dog ikke føre til en drastisk stigning i de hardware-ressourcer vi bruger. Ved at bruge de nye værktøjer og teknikker, der er udviklet i RAD-projektet, kan dataforskere bruge og dele deres eksisterende hardware-ressourcer mere effektivt og derved formindske CO2-fodaftryk af deres arbejdsbyrde.
Det giver mig mulighed for at opbygge en førende uafhængig forskergruppe, der vil styrke ekspertisen inden for bygning af ressourcebevidst data science infrastruktur både i Danmark og internationalt. Projektet danner basis for samarbejde med både førende internationale forskningsgrupper og data science forskere.
Jeg bor i København. Jeg kommer fra Sortehavskysten i Tyrkiet. Derfor elsker jeg at være tæt på havet, og jeg har ikke noget imod mørkt vejr, så jeg kan godt lide at bo i København. Min yndlingshobby er at gå i biografen, og mit yndlingssted i København er Husets Biograf.
IT-Universitetet i København
Institut for Datalogi, (DASYA) lab, IT-Universitetet i København
Data-intensive systems and applications on modern hardware
København
Zonguldak Science High School, Zonguldak, Turkey