Die Nadel im Heuhaufen: Korrekturen der Musikincipits in RISM
Thursday, April 25, 2024
Seit seiner Gründung vor über siebzig Jahren war RISM ein Schaufenster für groß angelegte Kooperationen, die sich in erster Linie auf die Katalogisierung von Primärquellen aus aller Welt durch unsere internationalen Arbeitsgruppen bezogen. In den letzten Jahren hat sich die RISM-Redaktion jedoch zunehmend in institutionellen Kooperationen engagiert, um die Erschließungsinfrastruktur weiterzuentwickeln und unsere Daten insgesamt zu verbessern. Ein Beispiel dafür ist das Ende 2021 gestartete Incipit-Projekt, das die Qualität der weit über zwei Millionen Musikincipits in den mehr als 1,5 Millionen Quellenbeschreibungen von RISM verbessern soll. An diesem Großprojekt ist - neben der Zentralredaktion und dem RISM Digital Center als sozusagen üblichen Verdächtigen - Carlo Licciulli vom Centre for Digital Music Documentation (CDMD) der Akademie der Wissenschaften und der Literatur in Mainz maßgeblich beteiligt, nicht zuletzt dank des großzügigen Engagements der Sächsischen Landes- und Universitätsbibliothek Dresden (SLUB). Organisatorisch steht das Projekt unter dem Dach von NFDI4Culture.
Die Idee, sich speziell mit Musikincipits zu befassen, entstand durch eine wesentliche Verbesserung der RISM-Katalogisierungsanwendung Muscat, dank der Kolleginnen und Kollegen, die ihren Quellenbeschreibungen Musikincipits hinzufügen, nicht nur sofort eine visuelle Darstellung der Noten sehen, sondern auch Benachrichtigungen von Verovio - der vom RISM Digital Center im Hintergrund entwickelten Software - erhalten, wenn ihr Code möglicherweise nicht den Richtlinien entspricht. Während diese Funktion die Katalogisierung erheblich erleichtert und sicherstellt, dass die jetzt eingegebenen Incipits von gleichbleibend hoher Qualität sind, erscheinen die roten Validierungsmeldungen auch, wenn man einen Datensatz öffnet, der vor der Einführung dieser neuen Funktion kodiert wurde, obwohl von unseren Arbeitsgruppen kaum erwartet werden kann, dass sie zu diesen Incipits zurückkehren und den vor mehreren Jahren (oder sogar Jahrzehnten) eingegebenen Plaine & Easie Code systematisch überarbeiten. Mit diesen älteren Daten beschäftigt sich unser Incipit-Projekt, wobei wir nicht nur versuchen, die Fehler zu finden, sondern auch Wege zu finden, sie zu korrigieren, vorzugsweise mit sorgfältig entwickelten Skripten, da die manuelle Korrektur sehr zeitaufwendig ist und daher auf die problematischsten Fälle beschränkt bleiben muss.
In der Anfangsphase wurden allgemeine Merkmale wie Schlüssel, Tonart und Taktart oder die Nummerierung der Incipits berücksichtigt, aber jetzt befinden wir uns sozusagen mitten im Heuhaufen und schauen uns genauer an, was es mit seltsam platzierten Vorzeichen, nicht geschlossenen (oder nicht geöffneten) Balken und einer Vielzahl von deplazierten Zeichen - die in Plaine & Easie keine Bedeutung haben - auf sich hat. In der letztgenannten Kategorie sind einige Unstimmigkeiten leicht zu entdecken und zu korrigieren (z.B. wenn ein Text, der ursprünglich für ein anderes Feld bestimmt war, irrtümlich in den Incipit-Code eingetragen wurde), während typographische Fehler sich oft als schwierig zu korrigieren erweisen. Es sei denn, sie erscheinen mehr oder weniger systematisch (wie z.B. die Zahl 7, die anstelle eines Strichs erscheint, weil der Katalogisierer - vor einer Tastatur mit deutschem Layout sitzend - vergessen hat, gleichzeitig die Umschalttaste zu drücken). Von größerer Relevanz ist die Identifizierung einer bestimmten couleur locale, wenn z.B. ein Katalogisierer (oder sogar mehrere Mitglieder derselben Arbeitsgruppe) dazu neigte, ein Merkmal etwas unregelmäßig zu kodieren, denn solche Idiosynkrasien können - einmal entdeckt - eine systematische Korrektur mit einem Skript ermöglichen. Alles in allem ist die tägliche Arbeit mit diesen Musikincipits faszinierend und erweist sich als Lehrbeispiel dafür, wie Editoren - die den größeren Kontext der musikalischen Quellen verstehen und daher rekonstruieren können, was eine fehlerhafte Kodierung im Original wahrscheinlich bedeutet - und Informatiker - die verschiedene Aspekte der Daten analysieren und schließlich die Skripte für die Korrektur schreiben - Hand in Hand arbeiten müssen, um die beste Art der Korrektur für jedes Incipit zu finden.
Im Rahmen dieser wichtigen Initiative haben wir bereits ca. 150.000 Korrekturen per Skript und ca. 6.000 Korrekturen per Hand vorgenommen, aber es bleibt noch viel zu tun, und angesichts der Komplexität der festgestellten Probleme muss jeder Schritt sehr sorgfältig überwacht werden. Das wichtigste Ziel des Projekts ist jedoch ein noch ehrgeizigeres: Durch die Bereinigung der Plaine- und Easie-Kodierungen stellen wir sicher, dass die Suche nach Notenincipits (sei es im RISM Catalog oder in RISM Online) immer effektiver wird und möglichst viele und relevante Treffer liefert. Dies dürfte nicht nur unsere Nutzer erfreuen, für die die Incipit-Suche eine der beliebtesten Funktionen der umfangreichen RISM-Online-Datenbank ist, sondern sollte uns langfristig auch in die Lage versetzen, die Zahl anonymer oder falsch zugeschriebener Quellen zu verringern, indem wir sie mit besser dokumentierten Quelleneinträgen auf der Grundlage ähnlicher Notenincipits abgleichen.
Abbildung: Incipit im RISM-Katalogisierungsprogramm, RISM ID no. 390000007
Share Tweet EmailKategorie: Eigendarstellung