Gemeinsame Normdatei

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 7. März 2021 um 02:40 Uhr durch Kolja21 (Diskussion | Beiträge) (→‎Umfang). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Zur Navigation springen Zur Suche springen
Gemeinsame Normdatei

Gründung 2012
Bestand 9409221[1] (Stand: Februar 2023)
Ort Frankfurt am Main
ISIL DE-588
Betreiber Deutsche Nationalbibliothek u. a.

Die Gemeinsame Normdatei (GND) ist eine Normdatei für Personen, Körperschaften, Kongresse, Geografika, Sachschlagwörter und Werktitel, die vor allem zur Katalogisierung von Literatur in Bibliotheken dient, zunehmend aber auch von Archiven, Museen, Projekten und in Web-Anwendungen genutzt wird. Sie wird von der Deutschen Nationalbibliothek (DNB), allen deutschsprachigen Bibliotheksverbünden, der Zeitschriftendatenbank (ZDB) und zahlreichen weiteren Institutionen kooperativ geführt. Normdaten erleichtern die Katalogisierung, bieten eindeutige Sucheinstiege und die Möglichkeit der Vernetzung unterschiedlicher Informationsressourcen.

Die GND löste am 19. April 2012 die bis dahin getrennt geführten Normdateien Personennamendatei (PND), Gemeinsame Körperschaftsdatei (GKD), Schlagwortnormdatei (SWD) und die Einheitssachtitel-Datei des Deutschen Musikarchivs (DMA-EST-Datei) ab. Seit Juli 2014 werden die Normdaten nach den RDA-Regeln erfasst, die unter anderem auch von der Library of Congress verwendet werden.[2]

Grundlagen

Beispiel Personendaten (Screenshot, Mai 2012)

Die Gemeinsame Normdatei wurde von 2009 bis 2012 in einem gemeinsamen Projekt der Deutschen Nationalbibliothek, der deutschsprachigen Bibliotheksverbünde sowie der Zeitschriftendatenbank entwickelt. Ziel des Projekts war die Zusammenführung der bisher getrennt geführten Normdateien GKD, PND und SWD sowie der DMA-EST-Datei. Dabei sollten ein gemeinsames Datenformat realisiert und die vorhandenen Regelwerksunterschiede harmonisiert werden.

Der Erstellung von Normdatensätzen lagen früher unterschiedliche Regelwerke zugrunde. Dies waren die „Regeln für die alphabetische Katalogisierung“ (RAK-WB und RAK-Musik) für die Formalerschließung sowie die „Regeln für den Schlagwortkatalog“ (RSWK) für die Inhaltserschließung. Die uneinheitlichen Regeln zur Bildung der Vorzugsbenennung für die Formal- und Inhaltserschließung führten insbesondere im Bereich Körperschaften, Kongresse und Geografika zu redundanten Datensätzen in der GKD und der SWD. Daher wurden für die GND für die Fälle, in denen die Regeln der Formal- und Inhaltserschließung voneinander abweichen, Übergangsregeln erarbeitet, die eine gemeinsame Nutzung der Normdatensätze ermöglichen. Die Übergangsregeln berücksichtigten so weit wie möglich bereits die Regelungen der RDA (Resource Description and Access).

Auch die Datenformate der Normdateien, sowohl die Internformate als auch die Austauschformate, unterschieden sich teilweise beträchtlich. Das Austauschformat der GND basiert auf MARC 21 Authority. Durch die Zusammenführung aller Normdatensätze in der GND konnten die zuvor bestehenden Formatunterschiede überwunden werden. Bereits vorhandene parallele Datensätze aus den unterschiedlichen Normdateien können jedoch erst im Laufe der Zeit zusammengeführt werden.

Im Projekt Virtual International Authority File (VIAF) wird die GND mit anderen Normdateien virtuell zu einer internationalen Normdatei verbunden.

Inhalt

Umfang

Die Gemeinsame Normdatei enthält rund 8,8 Mio. Datensätze (Stand: 13. Februar 2021) folgender Entitätentypen:

Entitäten in der GND: Anzahl nach Entitätentyp im Zeitablauf
Entitätentyp / Datum Personen
(individualisiert)
Personennamen
(nicht individualisiert)
Personen und
Personennamen
(gesamt)
Körperschaften Konferenzen und
Veranstaltungen
Geografika Sachbegriffe Werke gesamt
Entitätencode p n -- k v g s w --
Juni 2013 2.882.000 4.628.000 (7.510.000) 1.172.000 587.000 293.000 202.000 193.000 (9.957.000)
2015[3] keine Angabe keine Angabe 8.669.790 1.240.852 619.610 289.449 205.586 244.480 11.269.767
2016[4] keine Angabe keine Angabe 10.546.959 1.498.606 769.067 295.027 207.149 287.204 13.604.012
2017[5] keine Angabe keine Angabe 11.551.274 1.493.823 786.180 300.138 209.003 331.310 14.671.728
2018[6] keine Angabe keine Angabe 12.032.087 1.487.938 803.612 305.543 211.339 367.574 15.208.093
2019[7] keine Angabe keine Angabe 12.265.826 1.490.830 826.579 310.860 212.775 405.899 15.512.769
Februar 2021[8] 5.251.171 7.046.133 12.297.304 1.491.072 829.548 311.357 212.895 410.736 15.552.912
Juni 2020[9] 5.350.953 weggefallen (5.350.953) 1.491.358 836.410 313.058 213.257 425.718 8.630.754
13. Okt. 2020[10] 5.421.947 weggefallen (5.421.947) 1.490.757 842.725 314.492 213.528 442.181 8.725.630
13. Feb. 2021[11] 5.496.766 weggefallen (5.496.766) 1.495.527 848.846 315.924 213.779 456.893 8.827.735

Entitätentypen

Die hier aufgeführten Entitätentypen entsprechen in Bibliotheken sogenannten Satzarten (Datensatzart).

In der Gemeinsamen Normdatei wird zu jeder Entitätenbeschreibung eine eindeutige Identifikationsnummer (Grundlage für den Uniform Resource Identifier), eine normierte Vorzugsbenennung, abweichende Namensformen und verschiedene beschreibende Attribute verzeichnet. Die Attribute werden möglichst als Relationen zu anderen Normdatensätzen abgelegt, wobei die Art der Beziehung jeweils codiert ist.[12] Beispiele für relationierte Attribute sind Geburts- und Sterbeorte von Personen sowie ihre Berufe. Für Körperschaften können u. a. Vorgänger- und Nachfolgerbeziehungen, aber auch administrative Überordnungen angegeben werden.

Auf diese Weise entsteht ein Netz von miteinander in Beziehung stehenden Datensätzen (Linked Data), das sich besonders für die Nutzung im Web eignet, die Navigation innerhalb der Normdatei erlaubt und somit die Recherchemöglichkeiten für Nutzer verbessert.

Ende August 2019 wurde die Vergabe von Tn-Nummern eingestellt.[13] Ein Jahr später, ab dem 19. Juni 2020, wurden die Verknüpfungen der Tn in den Titeldaten rückwirkend gelöst. Statt der Verknüpfungen gibt es nur noch Textstrings. Seit Juli 2020 sind die Namensdatensätze nicht mehr Bestandteil der Gemeinsamen Normdatei.[14]

Entitätenuntertypen

Abgesehen von Personennamen kann jede Satzart durch die Angabe eines Entitätencodes[15] in sich weiter differenziert werden. So kann ein Geografikum beispielsweise ein Bauwerk oder ein Staat sein. Insgesamt stehen rund 50 Entitätentypen zur Verfügung.

Entitätencodierung

Code Definition[16]
g Geografika
gib Bauwerke und Bauensembles, Monumentalplastiken, Denkmäler, Grabmäler u. ä. gemäß RSWK §730,1
gif; gik Gliedstaaten (sie werden immer mit „gik“ doppelt codiert)
gik Gebietskörperschaften und Verwaltungseinheiten
gil; gik Länder, Staaten (selbstständig) (sie werden immer mit „gik“ doppelt codiert)
gin Natürliche geografische Einheiten, biogeografische und paläografische Einheiten, Namen von geografischen Teileinheiten mit Himmelsrichtung bzw. mit anderen Wendungen gemäß RSWK § 205, 1 und 2
gio Kleinräumige Geografika innerhalb eines Ortes, ausgenommen Bauwerke und Bauensembles
gir; gik Geistliche Reichsfürstenrtümer (bis 1803), Verwaltungseinheiten der Ostkirche (sie werden immer mit „gik“ doppelt codiert)
giv; gik Verwaltungseinheiten, die gemäß der EH-G-03 einen instantiellen Oberbegriff von dem Gattungsbegriff der Verwaltungseinheit bekommen (sie werden immer mit „gik“ doppelt codiert)
giw Grenzen, Wege, Linien
gix Estraterrestrika
giz Alle geografischen Namen, die sich keinem der anderen Entitäten-Untertypen zuordnen lassen, Regionen und Gebiete gem. RSWK § 204a, einschließlich des Umlands einzelner Städte und Gemeinden
gxz Fiktive Orte
k Körperschaften
kif Firmen (ab Januar 2016)
kim Musikalische Körperschaften (ab Januar 2016)
kio Organe von Gebietskörperschaften
kip Projekte und projektähnliche Vorhaben und Programme
kiv; kir Religiöse Verwaltungseinheiten (z. B. Diözesen der Katholischen Kirche; Ausnahme: Verwaltungseinheiten der Ostkirche, Verwaltungseinheiten der Ostkirche werden mit „gir“ und „gik“ codiert) (sie werden immer mit „kir“ doppelt codiert) (ab Januar 2016)
kiz Alle übrigen Körperschaften, die keinem anderen speziellen Entitätentyp zugehören
kxz Fiktive Körperschaften
p Personen
pif Familien
pik Regierende Fürsten, Mitglieder regierender Fürstenhäuser
pip Pseudonyme
pis Sammelpseudonyme
piz Personennamen, die keinem anderen speziellen Entitätentyp zugehören
pxg Götter
pxl Literarische Gestalten, Sagengestalten
pxs Geister
s Sachbegriffe
sab; saz Musikalische Besetzung (gemäß RDA 6.15) (sie werden immer mit „saz“ doppelt codiert) (ab Januar 2016)
sad; saz Datenträger (gemäß RDA 3.4.1.3 D-A-C-H) (sie werden immer mit „saz“ doppelt codiert)
saf; saz Formangaben zu Art des Inhalts (gemäß RDA 7.2.1.3 D-A-C-H) (sie werden immer mit „saz“ doppelt codiert)
sag; saz Musikalisches Genre (gemäß RDA 6.14.2.5.2 D-A-CH) (sie werden immer mit „saz“ doppelt codiert) (ab Januar 2016)
sam; saz Musikalische Ausgabeform (gemäß RDA 7.20.1.3 D-A-C-H) (sie werden immer mit „saz“ doppelt codiert)
saz Allgemeinbegriffe, d. h. alle Sachschlagwörter, die keinem anderen speziellen Entitätentyp zugehören
sie Ethnografika
sif Verkehrsmittel mit Individualnamen
sih Historische Einzelereignisse
sip Produkte und Markennamen außer Softwareprodukte („siw“)
sis Sprachen
siu Personengruppen, die keine Körperschaft sind
siw Softwareprodukte
siz Alle individuellen Sachverhalte, die als Sachbegriffe erfasst werden und sich keinem der anderen Entitäten-Untertypen zuordnen lassen, z. B. Wettbewerbe
slz Buchstaben, Morpheme, Wörter als Gegenstand linguistischer Untersuchungen
snz Nomenklatur Biologie – Chemie
sxz Fiktive Sachbegriffe
szz Alle Zweifelsfälle für alle Entitäten
u
uiz Unkörperschaften (nur in Altdaten)
v Konferenzen und Veranstaltungen
vie Konferenzen, Veranstaltungen
vif Konferenzfolgen bzw. -reihen, Veranstaltungsfolgen bzw. -reihen w
w Werke
wid Druckermarken
wie Expression
wif Fassung eines Werks der Musik (ab Juli 2014 nicht mehr verwendet)
wim Werke der Musik
win Sammlungen
wip Provenienzmerkmale
wis Schriftdenkmäler
wit Werke

Nutzung und Schnittstellen

Die Gemeinsame Normdatei wird bei der Deutschen Nationalbibliothek gehalten. Die Bibliotheksverbünde haben den GND-Grundbestand einmalig in ihre Verbundsysteme eingespielt und beziehen seitdem die Aktualisierungen der Normdatei über das OAI-Verfahren. Die GND wird nicht nur von Bibliotheken, sondern auch von Archiven (bisher v. a. von wissenschaftlichen und Literaturarchiven), Museen und Redaktionen von Nachschlagewerken bearbeitet und erweitert. Die Mitarbeit erfolgt entweder über Bibliotheksverbünde oder nach Absprache mit der Deutschen Nationalbibliothek. Die Nutzung durch staatliche und kommunale Archive läuft (Stand 2015) erst an.

Die GND-Normdaten stehen auf der Webseite der DNB in den Formaten MARC 21 Authority, MARC21-xml und RDFxml entgeltfrei unter der Lizenz CC0 1.0 zur Verfügung.

Institutionenübergreifende Integration von Normdaten

Zusammenführung verschiedener Quellen zu Franz Beckenbauer mittels des BEACON-Formats

Im Dezember 2012 wurde unter dem Namen Institutionenübergreifende Integration von Normdaten (IN2N) ein Kooperationsprojekt zwischen der Deutschen Nationalbibliothek (DNB) und dem Deutschen Filminstitut (DIF) gestartet. Ziel des von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projektes ist es, Institutionen außerhalb des Bibliothekswesens bei der Nutzung der GND zu unterstützen und in die Erschließung einzubeziehen.[17] Unter anderem wurden im Rahmen des Projektes bereits die Datensätze aus filmportal.de mit den Personenartikeln aus Wikipedia abgeglichen.[18]

Ende 2014 wurden die Normdaten des DIF in die GND eingespielt. In den Monaten davor wurden unter anderem bereits Daten des Ibero-Amerikanischen Instituts (Berlin) und der Forschungsstelle Osteuropa an der Universität Bremen in die GND übernommen. Seit dem 6. Mai 2016 können Wikipedianer, die an einer entsprechenden Schulung teilgenommen haben, über das „GND-Webformular“ Normdaten für Personen anlegen. Die dazugehörige Bibliothekskennung lautet Wikimedia Deutschland (DE-B1592).

Literatur

  • Renate Behrens-Neumann: Die Gemeinsame Normdatei (GND). Ein Projekt kommt zum Abschluss. In: Dialog mit Bibliotheken. Band 24, Heft 1, 2012, ISSN 0936-1138, S. 25–28, (PDF; 130 kB).
  • Eva-Maria Gulder: Die Gemeinsame Normdatei (GND). Bayerische Staatsbibliothek München (Normdatenredaktion), September 2011, (PDF; 2,84 MB).
  • Thekla Kluttig: Gemeinsame Normdatei und Archive – was soll das? In: Clemens Rehm, Monika Storm, Andrea Wettmann (Hrsg.): Nachlässe – Neue Wege der Überlieferung im Verbund. Gemeinsame Frühjahrstagung FG 1 und FG 6 für alle Fachgruppen im VdA. 7. Mai 2013, Staatsarchiv Chemnitz (= Veröffentlichungen des Sächsischen Staatsarchivs. Reihe A: Archivverzeichnisse, Editionen und Fachbeiträge. 17). Mitteldeutscher Verlag, Halle (Saale) 2014, ISBN 978-3-95462-388-4, S. 85–88.
  • Barbara Pfeifer: Vom Projekt zum Einsatz. Die gemeinsame Normdatei (GND). In: Klaus-Rainer Brintzinger, Ulrich Hohoff (Hrsg.): Bibliotheken: Tore zur Welt des Wissens. 101. Deutscher Bibliothekartag in Hamburg 2012. Olms, Hildesheim u. a. 2013, ISBN 978-3-487-14888-5, S. 80–91.
  • Fabian Steeg, Adrian Pohl, Pascal Christoph: lobid-gnd – Eine Schnittstelle zur Gemeinsamen Normdatei für Mensch und Maschine. In: Informationspraxis. Band 5, Nr. 1, 2019, ISSN 2297-3249, doi:10.11588/ip.2019.1.52673 (uni-heidelberg.de).
  • Brigitte Wiechmann: Die Gemeinsame Normdatei (GND). Rückblick und Ausblick. In: Dialog mit Bibliotheken. Band 24, Heft 2, 2012, S. 20–22, (PDF; 465 kB).

Weblinks

Einzelnachweise

  1. GND-Daten Gesamtbestand. 13. Februar 2023 (abgerufen am 28. April 2023).
  2. Renate Behrens, Christine Frodl: Erste Meilensteine im RDA-Projekt. In: Dialog mit Bibliotheken. Band 26, Heft 1, 2014, S. 25–31, hier S. 28, (PDF; 310 kB).
  3. Deutsche Nationalbibliothek – Jahresbericht 2015, S. 49. Abgerufen am 3. Juni 2016.
  4. Deutsche Nationalbibliothek – Jahresbericht 2016, S. 51. Abgerufen am 13. April 2019.
  5. Deutsche Nationalbibliothek – Jahresbericht 2017, S. 51. Abgerufen am 13. April 2019.
  6. Deutsche Nationalbibliothek – Jahresbericht 2018, S. 49. Abgerufen am 27. Januar 2020.
  7. Deutsche Nationalbibliothek – Jahresbericht 2019, S. 49. Abgerufen am 24. Juni 2020.
  8. data.dnb.de, Stand: 13. Februar 2020. Abrufdatum: 2. Juli 2020.
  9. data.dnb.de, Stand: 22. Juni 2020. Abrufdatum: 15. Juli 2020.
  10. data.dnb.de, Stand: 13. Oktober 2020 12:20 Uhr UTC. Abrufdatum: 20. Februar 2021.
  11. data.dnb.de, Stand: 13. Februar 2021 13:20 Uhr UTC. Abrufdatum: 5. März 2021.
  12. GND: Liste der Codierungen in Unterfeld $4 – alphabetisch nach Code (Memento vom 23. September 2015 im Internet Archive).
  13. Die Abkürzung „Tn“ steht für Thesaurus Name und bezeichnet nicht individualisierte Namensdatensätzen. In VIAF als „undifferentiated“ gekennzeichnet.
  14. „Abschaffung von Tn-Normdaten in der GND mit Auswirkung auf die Titeldaten der DNB“, 28. Mai 2020. Abrufdatum: 14. Juli 2020.
  15. GND-Entitätencodierung Vergaberichtlinien (Memento vom 23. September 2015 im Internet Archive) (Stand: 21. Juni 2013).
  16. „Entitätencodierung – Vergaberichtlinien“ (Stand: 15. November 2018)
  17. IN2N (Memento vom 12. August 2015 im Internet Archive), Deutsches Filminstitut, Abfragedatum: 21. November 2013.
  18. Alexander Haffner: Institutionenübergreifende Integration von Normdaten (IN2N). In: Dialog mit Bibliotheken. Band 25, Heft 2, 2013, S. 42–45, (PDF; 54 kB).