datenfabrik.merge
Die SSIS-Komponente datenfabrik.merge verschmilzt Dubletten inner-
halb von strukturierten Daten. Doppelte Daten werden anhand eines
Gruppierungsschlüssels zusammengefasst und zu einem einzigen
Datensatz verschmolzen. Die Ausgabespalten werden dabei über ver-
schiedene Aggregate, mathematische Funktionen oder durch das Auf-
füllen aus anderen Datensätzen innerhalb der Gruppierung erstellt.
Dieses, auch Record Linkage genannte, Verfahren eignet sich be-
sonders, mit datenfabrik.dedupe erkannte Dubletten weiterzuver-
arbeiten.
Funktionsübersicht
- Gruppierung der Eingabedaten über einen speziellen Schlüssel
- Berechnung neuer Spalten über Aggregate und mathematische Funktionen
- Bildung neuer Spalten durch verschiedene String-Funktionen
- Neusortierung der Daten innerhalb spezieller Funktionen
- Mehrfach vorkommende Datensätzen können zu einem Datensatz verschmolzen werden
© 2009 by datenfabrik GmbH & Co. KG