118.649 vacatures

18 sep 2024

Afstudeeropdracht in Data Engineering: Testdata genereren met behulp van AI

Branche Zie onder
Dienstverband Zie onder
Uren Zie onder
Locatie Veenendaal
Salarisindicaties 0-5.000
Opleidingsniveau Zie onder
Organisatie Info Support
Contactpersoon Info Support Nederland
0318552020

Informatie

Een goede set testdata. Een heel belangrijk onderdeel als je als data engineer werkt. Zodat je wat je hebt gebouwd, buiten productie, goed kan testen. Productie data gebruiken is uiteraard niet mogelijk. Maar zou je AI kunnen inzetten voor het selecteren/genereren van edge cases. Dat ga jij tijdens deze opdracht uitzoeken.   

Omschrijving

Een goede set testdata. Een heel belangrijk onderdeel als je als data engineer werkt. Zodat je wat je hebt gebouwd, buiten productie, goed kan testen. Productie data gebruiken is uiteraard niet mogelijk. Maar zou je AI kunnen inzetten voor het selecteren/genereren van edge cases. Dat ga jij tijdens deze opdracht uitzoeken.   

Functie eisen

Als data engineer wil je graag kunnen testen dat hetgene wat je hebt gemaakt, bijvoorbeeld ETL pipelines die business logica bevatten, ook daadwerkelijk datgene doet wat je had verwacht. Niet enkel op technisch vlak, juist ook functioneel. Daarvoor heb je een goede, representatieve set testdata nodig. Hoe kom je aan die data? Het is helaas niet zo simpel als het lijkt: productiedata gebruiken in een testomgeving is uiteraard een no-go, maar hoe krijg je dan wel een werkbare set data die alle bestaande relaties tussen velden, kolommen, tabellen etc. in stand houdt? En hoe weet je of je voldoende ‘edge cases' in je testdata hebt zitten? 

Solliciteer direct