GND-Dokumentation

From gnd-doku
Jump to navigation Jump to search

200px|left|GND-Logo Die GND ist ein Gemeinschaftsprojekt von Archiven, Bibliotheken, Museen und ähnlichen Gedächtnis-Institutionen des deutschsprachigen Raums. Sie dient der gemeinschaftlichen Erarbeitung und einheitlichen Verwendung eines Sets genormter Vokabulare für die Erschließung von Sammlungen und Ressourcen. Die in der GND repräsentierten Entitäten sind durch strukturiert erfasste Eigenschaften eindeutig identifiziert. Damit ist es möglich, diese zu referenzieren und die Auffindbarkeit der Ressourcen und die Vernetzung zwischen den lokalen Katalogen und Portalen zu verbessern.
Die GND wird kooperativ geführt und an der Deutschen Nationalbibliothek (DNB) betrieben.
Die GND-Normdaten stehen allen Interessenten in den Formaten MARC 21 Authority, MARC 21-xml und RDFxml kostenfrei unter der Lizenz CC0 1.0 zur Verfügung.

Die GND beschreibt Entitäten und deren Relationen

Die GND beinhaltet Normdatensätze. Das, was ein Normdatensatz repräsentiert, bezeichnen wir als Entität. Die GND ist eine Datenbank, die Entitäten und deren Beziehungen (auch Relationen genannt) beschreibt. Relationen können sowohl zwischen Normdatensätzen der GND als auch mit anderen Datenbanken bestehen.

Normdatensätze und Entitäten

Entitäten und Normdatensätze werden in der Alltagssprache der GND-Anwendung häufig gleichgesetzt. Diese kleine Ungenauigkeit stellt meist kein Problem dar, aber leider hat sie sich in der Vergangenheit bis in die Dokumentationen eingeschlichen. Daher gehen wir an dieser Stelle noch einmal auf den Unterschied ein: Ein Normdatensatz repräsentiert eine Entität in der GND - ähnlich einer Karteikarte. Der Normdatensatz enthält prägnante Informationen rund um diese Entität (z.B. deren Namen oder Bezeichnung, prägende Orte und Daten). Gleichzeitig beinhaltet er aber auch Informationen, die sich auf den Datensatz selbst beziehen (z.B. das letzte Änderungsdatum des Datensatzes). Diese Unterscheidung wurde in der GND bislang nicht immer genau genommen. Mit Blick auf die Vernetzung mit anderen Datenquellen über die Konzepte des Semantic Web ist es allerdings wichtig, hier zumindest in der Dokumentation und im Datenmodell präzise zu sein. Dies ist es eine der Herausforderungen für die neue Dokumentation der GND.

Die wichtigsten Konzepte im Überblick

  • Ein Normdatensatz der GND repräsentiert eine Entitäten (bestimmte Personen, Körperschaften, Begriffe, ...)
  • Ein Normdatensätze enthält
    • Informationen zu dieser Entität, z.B. zur Benennung der Entität
    • sowie Informationen über den Normdatensatz selbst, z.B. zur Quelle und zum Datum der letzten Änderung
  • Diese Informationen bezeichnen wir als Aussagen (über die Entität oder den Datensatz) oder Eigenschaften (der Entität oder des Datensatzes).
  • Jede Aussage beinhaltet ein Datenfeld (z.B. "Bevorzugter Name", "Entstehungsjahr eines Werks" oder "Untergeordnete Körperschaft") und einen zugeordneten Wert.
  • Der Wert zu einem Merkmal kann ein Literal oder eine Referenz auf eine andere Entität sein.
  • Im zweiten Fall handelt es sich beim Datenfeld um eine Relation (oder Beziehung).
  • Bezeichnungen in verbreiteten Formaten/Modellen:
    • Im PICA- oder MARC-Format werden Datenfelder durch Kombinationen aus Feldnummer und Unterfeldzeichen kodiert. Der Wert wird als "Feldinhalt" oder "Unterfeldinhalt" bezeichnet. Referenzen zu anderen GND-Sätzen werden meist durch GND-Nummern ausgedrückt.
    • In RDF bezeichnet man das Datenfeld als "Prädikat" und dessen Wert als "Objekt". Handelt es sich bei dem Objekt um eine Referenz, wird dies durch eine URI ausgedrückt.
    • Die GND-Ontologie nutzt zudem den Standard "RDF Schema" (RDFS). In diesem werden Datenfelder als "Properties" (ins Deutsche meist als "Eigenschaften" übersetzt) bezeichnet.
    • Im ERM nennt man Datenfelder, die Literale als Wert haben, "Attribute". Datenfelder, die auf Entitäten referenzieren, werden auch in ERM als "Relationen" bezeichnet.
  • Entitäten lassen sich danach gruppieren, mit welchen Merkmalen sie beschrieben werden können. In der GND sind die Datensätze zu diesem Zweck bestimmten Entitätstypen zugeordnet. Ausgedrückt wird diese Zuordnung durch Entitätencodes, die wiederum jeweils mindestens einer Satzart zugeordnet sind.
  • Welche Merkmale einem bestimmten Entitätstyp zugeordnet sind und wie diese erfasst werden, ist in den zu Erfassungsregeln festgelegt.
  • Zwischen den GND-Entitäten bestehende Beziehungen werden durch die Eigenschaftsgruppe Relationen abgebildet. Je nach Entitätstyp der in Beziehung stehenden Entitäten gibt es jeweils ein Set an zulässigen Relationstypen.
  • Unterschiedliche GND-Anwendergruppen haben bei der Erarbeitung und Pflege der GND spezifische Befugisse und Aufgaben. Durch das Katalogisierungslevel ist jeder Datensatz einer Anwendergruppe zugeordnet.
  • In der kooperativ erarbeiteten GND können einzelne Entitäten nur für eine oder mehrere bestimmte Anwerdergruppen relevant sein. Deshalb sind die Entitäten bestimmten Teilbeständen zugeordnet.