Data Cleaner (Community Editie)

Beschikbaarheid

Body

DataCleaner is een sterke dataprofileringsengine voor het ontdekken en analyseren van de kwaliteit van uw data. Vind de patronen, ontbrekende waarden, tekensets en andere kenmerken van uw gegevenswaarden. Het opvragen en profileren van uw gegevens is een essentiële activiteit van elk Data Quality-, Master Data Management- of Data Governance-programma. Als je niet weet waar je mee te maken hebt, heb je weinig kans om het op te lossen.

DataCleaner is gebouwd om zowel grote als kleine gegevens te verwerken. DataCleaner kan omgaan met allerhande databronnen zoals: CSV-bestanden, Excel-spreadsheets, relationele databases (RDBM's) en NoSQL-databases. DataCleaner gebruikt externe en interne referentiegegevens om te controleren of de gegevenswaarden overeenkomen met de echte wereld. Met DataCleaner kunt men eigen opschoningsregels bouwen en deze samenstellen in verschillende gebruiksscenario's of doeldatabases. Of het nu gaat om eenvoudige zoek-/vervangregels, reguliere expressies, patroonovereenkomst of volledig aangepaste transformaties, het is allemaal mogelijk.

Pluggability en Connectivity zijn sleutelwoorden voor de open source ontwerpfilosofie van DataCleaner. De applicatie biedt niet alleen kant-en-klare functionaliteit, maar herbergt ook een ecosysteem van door de gemeenschap aangestuurde integratie van applicatie-extensies, gedeelde inhoud en meer. Ontwikkelaars hebben de mogelijkheid om DataCleaner in te sluiten in andere applicaties, plug-ins te bouwen voor het specifieke gebruik of zelfs adapters te gebruiken die DataCleaner laten werken met Apache Hadoop en Apache Spark. Andere prominente integraties bestaan rond de integratie met Pentaho Data Integration, evenals ondersteuning voor aangepaste gegevensbrondefinities via het Apache MetaModel-framework.

Data Profiling Tekst
Full:Cardinalities;Full:Duplicate Detection;Full:Patterns and Domains;Partial:Value Distributions

Data Quality Measurement

Data Quality Measurement Tekst
Partial:Completeness
Data Quality Monitoring Tekst
Full:Storage of results;Full:Task scheduling
Documentatie Beschikbaar
Uit
Abonneer op Full:Patterns and Domains