Data mining metoder, der anvendes på forskellige problemstillinger fra forskellige områder af ikke-ekspert brugere, vil typisk give et eller andet resultat, selv om der ikke er nogen egentlige eller tydelige mønstre eller fakta at uddrage fra de foreliggende data.
Det er derfor svært for brugeren, ja selv for eksperter, at vurdere resultaternes gyldighed og anvendelighed.
Så selv om en metode rapporterer klynger eller ekstreme observationer til brugeren, har brugeren ikke pålidelige teknikker til at vurdere gyldigheden af sådanne resultater.
Denne mangel på pålidelighed kan gøre efterfølgende skridt og konklusioner fejlbehæftede eller meningsløse.
Dette projekt sigter mod at forbedre de teoretiske teknikker til forståelse af data mining, hvilket har praktisk relevans i forbindelse med at sikre en bedre forståelse af evalueringsprocedurerne til klyngedannelse, forbedring af ensembler og evaluering af detektion af ekstreme observationer, samt identifikation af relationer mellem datasætegenskaber og metodekvalitet.