Mein aktuelles Lieblingstool heisst Open Refine. Man kann damit auf sehr einfache Weise Daten bereinigen, Daten vereinheitlichen, bestehende Daten mit der GND oder auch mit wikidata oder dem AAT verknüpfen oder vorhandene Daten mit Fremddaten anreichern.
Es ist auch möglich, reguläre Ausdrücke (Regex) zu integrieren.
Zum Einstieg empfehle ich den Workshop von Benjamin Rosemann: https://fdmlab.landesarchiv-bw.de/workshops/