Drake

Beschikbaarheid

Body

Drake is een eenvoudig te gebruiken, uitbreidbare, op tekst gebaseerde workflowtool voor gegevens die de uitvoering van opdrachten organiseert rond gegevens en de bijbehorende afhankelijkheden. Gegevensverwerkingsstappen worden gedefinieerd samen met hun invoer en uitvoer en Drake lost automatisch hun afhankelijkheden op en berekent: Welke opdrachten moeten worden uitgevoerd (op basis van bestandstijdstempels) en in welke volgorde de opdrachten moeten worden uitgevoerd (op basis van afhankelijkheden). Drake is vergelijkbaar met GNU Make, maar is speciaal ontworpen voor gegevensworkflowbeheer. Het heeft HDFS-ondersteuning, maakt meerdere in- en uitgangen mogelijk en bevat een groot aantal functies die zijn ontworpen om u te helpen uw anders chaotische workflows voor gegevensverwerking gezond te houden.

 

Belangrijk om te vermelden is dat Drake niet meer actief lijkt onderhouden te worden.

Data Profiling Tekst
Full:Value Distributions;Partial:Cardinalities;Partial:Correlation analysis;Partial:Duplicate Detection

Data Quality Measurement

Data Quality Measurement Tekst
Full:Accuracy;Partial:Completeness

Data Quality Monitoring

Data Quality Monitoring Tekst
Full:Storage of results
Documentatie Beschikbaar
Uit
Abonneer op Partial:Cardinalities