datenfabrik.dedupe
Bei dem Zusammenführen von Datenbeständen aus unterschiedlichen Systemen entstehen doppelte Datensätze, die sich nur schwer automatisiert finden lassen. datenfabrik.dedupe ist eine SSIS Datenflusskomponente zur Suche von Dubletten mit phonetischen Algorithmen. Die Komponente findet extrem schnell mehrfach vorhandene Datensätze in Adressbeständen und bietet eine einzigartige Symbiose von Treffergenauigkeit und Performance. Für den Abgleich von 15 Millionen Datensätzen benötigt datenfabrik.dedupe weniger als eine Stunde.
Funktionsübersicht
- Dublettensuche mit phonetischen Algorithmen
- Definition beliebiger Sortierschlüssel, der Suchumgebung (Sorted Neighbourhood) und beliebiger Such-Parametersets
- Minimaler Score pro Spalte und pro Parameterset
- Filter zur Normalisierung von Namen und Straßen
- Partielle Dublettensuche
- Speichern und Laden von Parametersets
© 2009 by datenfabrik GmbH & Co. KG