-
Inzichten leveren in belang van goede masterdatakwaliteit
December 2021 - Maart 2022
Op basis van een literatuuronderzoek en op basis van voorgaand onderzoek uitgevoerd aan HOGENT leggen we een aantal criteria vast waarmee masterdatakwaliteit kunnen worden gemeten. Deze criteria zullen later in het project gebruikt worden om de verbetering in masterdatakwaliteit te objectiveren, naast uiteraard de praktische (positieve) gevolgen van de verbeterede masterdatakwaliteit die de bedrijven ondervinden.
Door middel van een marktonderzoek bij de bedrijven uit de begeleidingsgroep maken we een inventaris op van de diverse problemen die bedrijven hebben bij het beheer van hun masterdata en de gevolgen hiervan op de masterdatakwaliteit.
-
Inventarisatie en creatie shortlist van de bestaande oplossingen op de markt
Maart 2022 - Mei 2022
Door middel van een uitgebreide en systematische zoektocht in documentdatabanken, vakpers en het algemene Internet wordt een uitgebreide lijst aangelegd van softwareoplossingen die zich toeleggen op het monitoren en verbeteren van datakwaliteit. Elk van de gevonden tools wordt op basis van de gevonden documentatie geëvalueerd op een aantal criteria, zoals prijs, licentie, hoe up-to-date de software is, enzovoort.
Nadat de longlist is vastgelegd zullen we enkel die tools overhouden die voldoen aan een aantal voor de hand liggende criteria zoals: prijs, licentie (is commercieel gebruik toegelaten?), laatste update (i.e. activiteit), populariteit en compatibiliteit met moderne operating systemen. Het resultaat van deze activiteit is een shortlist van oplossingen die het potentieel hebben om zinvol ingezet te worden bij de doelgroepbedrijven ter verbetering van hun masterdatakwaliteit.
-
Praktijktest en finale selectie van de oplossingen op de shortlist
Mei 2022 - Augustus 2022
Teneinde een gefundeerde beslissing en onafhankelijke adviezen te kunnen geven m.b.t. de bestaande oplossingen voorzien we in deze activiteit een aantal praktijktesten met de oplossingen op de shortlist. Elke oplossing wordt geïnstalleerd en wordt uitgetest op een aantal verschillende datasets, zowel beschikbare ‘academische’ datasets als datasets aangeleverd door bedrijven uit de begeleidingsgroep.
Elke oplossing wordt beoordeeld op een aantal criteria, zoals eenvoud van installatie, gebruik van de user interface en op de types fouten die de oplossingen kan aanduiden alsook of de oplossing suggesties ter verbetering kan aanbrengen.
De resultaten van de praktijktesten worden beschreven in een rapport dat ter beschikking wordt gesteld van de leden van de begeleidingsgroep en dat ook wordt gepubliceerd op de website van het project.
-
GAP-analyse & prioritisatie van functionaliteiten
Augustus 2022 - Oktober 2022
Na de praktijktesten wordt een bestaande oplossing uitgebreid met additionele functionaliteiten. Voor het implementeren van deze additionele functionaliteiten maken we gebruik van bestaande bibliotheken voor machine learning en bestaande implementaties van algoritmen/technieken beschreven in academische papers die echter nog niet geïntegreerd zijn in een gemakkelijk bruikbare oplossing.
Deze implementatie wordt voorzien van een uitgebreide documentatie in de vorm van tekst en videomateriaal. Hierbij wordt rekeningn gehouden dat de oplossing gemakkelijk te gebruiken blijft door de doelgroepbedrijven.
Op basis van de ervaringen met het gebruik van de gekozen oplossingen identificeren we de "gaps" tussen de functionaliteiten van de bestaande oplossingen en de functionaliteiten van de ‘ideale’ oplossing (GAP-analyse).
Tot slot worden er samen met de leden van de begeleidingsgroep de gewenste functionaliteiten geprioriteerd. Dit gebeurt op basis van de verwachte impact van de nieuwe functionaliteit alsook de haalbaarheid van de implementatie van zo’n nieuwe functionaliteit.
-
Implementatie van additionele functionaliteiten
Oktober 2022 - Februari 2023
Voor de implementatie van de slimme, AI-gebaseerde componenten maken we gebruik van bestaande en gevestigde softwarebibliotheken zoals sklearn en XGBoost implementaties voor Python. We trachten maximaal gebruik te maken van bestaande implementaties van bepaalde strategieën voor machinaal leren. De nadruk van de implementatie ligt op de integratie van deze methoden in een intuïtieve gebruikersinterface zodat de nieuwe functionaliteiten kunnen gebruikt worden door gebruikers die geen of slechts een zeer beperkte kennis hebben van de manier waarop de achterliggende algoritmen functioneren.
Tegelijkertijd zorgen we ervoor dat de implementatie zodanig wordt uitgevoerd dat er geen harde koppelingen zijn tussen de intelligente componenten en de gebruikersinterface. We doen dit door de intelligente componenten te voorzien van een duidelijk gedefinieerde REST API. Dit zorgt er enerzijds voor dat de projectresultaten breder inzetbaar zijn en niet afhangen van de gekozen oplossing, maar anderzijds is dit vooral ook een goede softwarearchitectuur die er voor zal zorgen dat de implementatie en het softwarematig testen (bv. m.b.v. unit testen) van de nieuwe componenten veel eenvoudiger wordt.
Om te garanderen dat de nieuwe functionaliteiten naar behoren werken worden deze door de onderzoekers getest, zowel handmatig als geautomatiseerd. Er wordt documentatie voorzien op verschillende niveaus: voor eindgebruikers wordt er gespecifieerd hoe ze via de gebruikersinterface toegang krijgen tot nieuwe functionaliteiten. Daarnaast is er ook technische documentatie die de API op een lager niveau beschrijft. Deze laatste documentatie is enkel bedoeld voor mensen met een IT-achtergrond, zoals de IT-dienstverleners in de waardeketen, die zorgen voor de optionele integratie in een bestaand ERP- of PIM-systeem.
We nemen ook demo-filmpjes (screencasts) op van het gebruik van de nieuwe functionaliteiten, en we geven demo’s aan de leden van de begeleidingsgroep. De filmpjes worden eveneens geïntegreerd in de projectwebsite.
-
Uitrollen bij doelgroepbedrijven
Februari 2023 - September 2023
In deze fase wordt de (uitgebreide) oplossing uitgetest in actuele bedrijfsomgevingen. We letten bij de keuze van de bedrijven op het feit dat deze tegelijkertijd representatief zijn voor de doelgroep en voldoende diversiteit vertonen. Op die manier krijgen we gevalideerde installaties en krijgen we zicht op de manier waarop de oplossing binnen een reële omgeving wordt ingezet en verzamelen we feedback van eindgebruikers bij het inzetten van de oplossing. Criteria waarop feedback kan gegeven worden zijn: gemak van installatie, intuïtiviteit van de gebruikersinterface, kwaliteit van de suggesties, snelheid van het aangeven van suggesties en snelheid en gemak van het doorvoeren van aanpassingen. Deze feedback vormt dan de basis voor verdere aanpassing en verbetering van de oplossing.
Binnen de begeleidingsgroep zoeken we een aantal bedrijven die de oplossing willen proefdraaien binnen hun bedrijfsomgeving. De personeelsleden van deze bedrijven installeren en gebruiken de oplossing volledig zelfstandig en rapporteren hun bevindingen aan het projectteam. Voor deze rapportage wordt een template aangebracht met de verschillende criteria waarop de oplossing kan gescoord worden waardoor de gegeven feedback relevant zal zijn voor het projectteam.
De feedback die verzameld werd tijdens het proofs-of-concept bij de bedrijven wordt door het projectteam geanalyseerd. Er worden gepaste acties ondernomen om, in de mate van het mogelijke, de onduidelijkheden of de inefficiënties binnen de software weg te werken. Dit alles gebeurt uiteraard in een iteratief proces.