Beschikbaarheid

Body

Deze geavanceerde tool, voorheen bekend als Google Refine, is handig voor het omgaan met 'dirty' gegevens, het opschonen en wijzigen ervan. OpenRefine is een Open Source-programma. Het belangrijkste voordeel ten opzichte van de andere tools op onze lijst is dat het gratis te gebruiken en te configureren is omdat het open source is.

OpenRefine kan gegevens converteren tussen meerdere indelingen en ervoor zorgen dat deze goed gestructureerd zijn. Het kan ook worden gebruikt om gegevens van internet te ontleden. Het lijkt op een relationele database. Dit maakt het zeer nuttig voor data-analisten die meer informatie willen dan een standaard Excel-bestand kan bieden.

Een ander belangrijk voordeel is dat de gegevens de eigen machine niet verlaten, waardoor de gegevens absoluut veilig blijven. OpenRefine kan connecteren met externe online diensten en andere cloudbronnen om een dataset te valideren of uit te breiden. Hoewel het een reeks complexe taken kan uitvoeren om het te gebruiken, heb je slechts een beperkte technische kennis nodig om OpenRefine te gebruiken.

Data Profiling Tekst
Full:Cardinalities;Full:Value Distributions;Partial:Cluster analysis;Partial:Duplicate Detection
Data Quality Measurement Tekst
Full:Creation and application of business rules

Data Quality Monitoring

Data Quality Monitoring Tekst
Full:Storage of results
Documentatie Beschikbaar
Aan