Fuzzy Matching: Nicht übereinstimmende Daten verbinden

Mit Power Query oder nun Daten abrufen und transformieren, kann man sehr performant Tabellen verbinden und benötigt keinen SVERWEIS() mehr. Allerdings ist auch Power Query darauf angewiesen, dass die Schlüsselkriterien übereinstimmen, ja es ist sogar noch strenger: Der Datentyp muss auch übereinstimmen! Irgendwann im Sommer 2019, mit einem wöchentlichen Update von Excel365 , gab es plötzlich für Power Query eine neue Funktionalität: Fuzzy Matching!

Damit können nun auch Datensätze verbunden werden, bei denen die Schlüsselkriterien ähnlich, aber nicht übereinstimmend sind. Diese neue Technik heißt Fuzzy Matching und ist als weitere Join-Variante verfügbar. Sie kann dann aktiviert werden, wenn man mit dem Befehl Abfragen zusammenführen arbeitet. Die gab es schon seit einiger Zeit für PowerBi, das ja Power Query und PowerPivot integriert hat.

Im folgenden Beispiel haben wir Abweichungen bei den Produktbezeichnungen zweier Tabellen. Hier sollen für die „A-Klasse K“  Umsatz und Kosten in einer Tabelle ausgegeben werden. In der zweiten Tabelle ist nur „A-Klasse“ zu finden. Keine Übereinstimmung!

Fuzzy1

Im Dialog Zusammenführen werden die beiden Tabellen angegeben und die Spalten, die die übereinstimmenden Merkmale enthalten (sollen).

Fuzzy2

Dann wird das Kontrollkästchen für Fuzzyübereinstimmung zum Zusammenführen verwenden aktiviert sowie die Optionen für die Fuzzyzusammenführung.

Der Schwellenwert für Ähnlichkeit muss experimentell herausgefunden werden. Je größer der Wert, desto mehr Wert legt man auf Übereinstimmung.

Achtung, das Dezimaltrennzeichen ist ein „.“ !!!

Die Maximale Anzahl von Übereinstimmungen setzen Sie auf „1“. Und das ist dann das Ergebnis:

Fuzzy3

Wer noch nicht mit Excel365 arbeitet, muss sich mit „Übersetzungstabellen“ behelfen.

Fuzzy4

Fazit:

Löst das Problem mit abweichenden Eingaben verschiedenen Datenquellen, meist verursacht durch fehlerhafte Datenerfassung oder Datenübertragung in verschiedenen IT-Systemen.

Mit wenigen Klicks ist dieses Problem gelöst und Dank Fuzzy Matching (Fuzzy = unklar, verschwommen) werden auch nicht übereinstimmende Datensätze perfekt zugeordnet.

Weitere Details….

können Sie in unseren Seminar Power Query 1:  – Daten laden, verdichten erfahren.

Dieser Eintrag wurde veröffentlicht in Allgemein, PowerQuery und getaggt mit , , am von .

Über Rainer Pollmann

Rainer Pollmann ist Geschäftsführender Partner von Pollmann & Rühm Training in Augsburg. Er studierte Wirtschaftsprüfung, Controlling und Organisationslehre (BWL) an der Universität Augsburg und ist seit 1989 aktiv als Trainer und Berater für Controller aktiv. Seit 2006 entwickelt er aktiv Branchenstandards im Kommunikations-Management als stellvertretender Leiter des Fachkreis Kommunikations-Controlling im Internationalen Controller Verein (ICV) mit.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google Foto

Du kommentierst mit Deinem Google-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s