Afstudeeropdracht in Data Engineering: Testdata genereren met behulp van AI
Branche | Zie onder |
Dienstverband | Zie onder |
Uren | Zie onder |
Locatie | Veenendaal |
Salarisindicaties | 0-5.000 |
Opleidingsniveau | Zie onder |
Organisatie | Info Support |
Contactpersoon |
Info Support Nederland 0318552020 |
Informatie
Omschrijving
Functie eisen
Als data engineer wil je graag kunnen testen dat hetgene wat je hebt gemaakt, bijvoorbeeld ETL pipelines die business logica bevatten, ook daadwerkelijk datgene doet wat je had verwacht. Niet enkel op technisch vlak, juist ook functioneel. Daarvoor heb je een goede, representatieve set testdata nodig. Hoe kom je aan die data? Het is helaas niet zo simpel als het lijkt: productiedata gebruiken in een testomgeving is uiteraard een no-go, maar hoe krijg je dan wel een werkbare set data die alle bestaande relaties tussen velden, kolommen, tabellen etc. in stand houdt? En hoe weet je of je voldoende ‘edge cases' in je testdata hebt zitten?