11. BSZ-Kolloquium 2010
Refine
Keywords
- BAM-Portal (2) (remove)
Language
- German (2)
Has Fulltext
- yes (2)
Year of publication
- 2010 (2)
Gliederung des Vortrags:
1. Metadaten aus BAM in XML-Format
2. Aufbau einer passenden Ontologie
3. Bildung von RDF-Tripel mit XSLT
4. RDF-Tripel à Datenbank
5. Web-Oberfläche mit Suchformular mit SPARQL-Abfrage-Logik
Abstract des Vortrags:
Das BSZ betreibt BAM, das gemeinsame Portal zu Bibliotheken, Archiven, Museen. Das Portal sammelt die Metadaten von diesen drei kulturellen Sektoren, indexiert sie mit Hilfe der technischen Plattform Lucene und macht sie als zentraler Nachweispunkt von Kulturgütern einer breiten Öffentlichkeit zugänglich. Gegenwärtig umfassen die Bestände des BAM-Portals rund 42,8 Millionen Datensätze, davon rund 1,8 Millionen Digitalisate, die von mehreren großen Bibliotheken bzw. Bibliotheksverbünden, 16 Museen und Museumsnetzwerken sowie mehreren Archiven eingebracht werden.
Auf Basis dieser Daten erstellt das BSZ zurzeit einen Prototyp, der diese Metadaten über XSLT-Transformationen in RDF-Tripel umwandelt. Die Tripel werden in eine Semantic-Web-taugliche Datenbank integriert und verknüpft. Mit einer prototypischen Implementierung einer Weboberfläche mit Suchformular können SPARQL-Abfrage-Logik und erste Ergebnisausgaben erprobt werden. Der Vortrag stellt die Vorgehensweise bei der Erstellung dieses Prototyps dar und präsentiert erste Ergebnisse, Erfahrungen und Erkenntnisse.
Die Deutsche Digitale Bibliothek ist eine von vielen weltweit laufenden Bemühungen, den online-Zugang für digitalisierte Information aus Kultur und Wissenschaft zu verbessern. Bereits Anfang des 20. Jahrhunderts hatte Paul Otlet die Idee der Ubiquität des Wissens, der elektronischen Übertragung von Bildern über Telefonleitungen direkt auf einen Fernsehbildschirm am Arbeitsplatz. Nicht nur Bücher, sondern Quellen auf unterschiedlichen Trägern (Text, Bild, Ton) und aus Archiven, Museen sowie anderen Gedächtnisinstitutionen sollten so zugänglich gemacht werden.
Die Deutsche Digitale Bibliothek ist ein Bund-Länder-Projekt der Bundesrepublik Deutschland. Es wird 2010 und 2011 aus dem Konjunkturprogramm II mit fünf Millionen Euro und ab 2011 für fünf Jahre mit 2.6 Mio. Euro jährlich finanziert. Das ist eine gute finanzielle Ausstattung des Projektes, die selbstverständlich die Erwartungen in das Ergebnis erheblich steigern. Es wird erwartet, dass die Zusammenarbeit mit dem Theseus-Programm, insbesondere das Teilprojekt Contentus die erwarteten Innovationen bei der besseren Nutzung der online verfügbaren Ressourcen ermöglicht. Die Deutsche Digitale Bibliothek wird nationaler Datenaggregator für die Europeana sein, eine Aufgabe, die den europäischen Regierungen bereits seit einiger Zeit von der Europäischen Kommission zugedacht worden war.
Einige Länder wie Frankreich, Österreich oder Italien haben solche Portale bereits seit einiger Zeit aufgebaut.
Daneben gibt es aber auch sog. Spartenportale, die z. B. aus Museen Europas (ATEHNA) oder europäischen Archiven (APEnet) Daten an Europeana liefern. Die Deutsche Digitale Bibliothek will nicht nur die Archive, Bibliotheken und Museen als Gedächtnisinstitutionen berücksichtigen, sondern auch Bild- und Filmarchive sowie Institutionen der Denkmalpflege. Inwieweit die Rundfunk- und Fernsehanstalten sowie die Verlage (Zeitungen, Zeitschriften, Bücher) mitarbeiten werden, ist noch Verhandlungssache.
Der Schwerpunkt der Angebote soll auf Digitalisaten in hoher Qualität liegen, d. h. bei Büchern möglichst OCR-erschlossene Volltexte. Auch die hohe Qualität der Metadaten zu den Digitalisaten ist wichtig, denn ein Teil der Ziele in Hinsicht auf die Verknüpfung der digitalen Objekten mit weiteren Internetressourcen (semantic web) lässt sich nur dann realisieren. Es ist den Beteiligten klar, dass hier am Beginn Kompromisse geschlossen werden müssen. Vielleicht helfen aber auch schon Werkzeuge zur automatischen Anreicherung der Daten z. B. durch entity recognition, die Daten besser vernetzbar zu machen. Eine solche Verbesserung der Daten könnte als Dienstleistung auch an die Institutionen zurückfließen, die die Daten liefern werden. Die grundsätzliche Ausrichtung der Deutschen Digitalen Bibliothek ist es, die angebotenen Digitalisate umsonst zugänglich zu machen. Doch wird für die Zukunft, z. B. wenn Verlagsangebote einbezogen werden, der Nachweis auch kommerzieller Angebote nicht ausgeschlossen. Die nicht kommerzielle Nutzung wird bedeutsam sein für den Aufbau der Deutschen Digitalen Bibliothek als Arbeitsplatz für Einzelne und Gruppen, als Möglichkeit, das Angebot mit anderen zu vernetzen und dort in anderen Umgebungen weiterzuentwickeln. Die Deutsche Digitale Bibliothek soll für Schüler/innen, Studierende, an Schulen und Hochschulen Lehrende, Journalist/innen und kulturell bzw. wissenschaftlich Interessierte ein Platz der Kooperation und der sozialen Vernetzung werden.
Die Deutsche Digitale Bibliothek will im sog. Extranet den Daten liefernden Kultur- und Wissenschaftseinrichtungen nicht nur die Möglichkeit eröffnen, ihre Daten hochzuladen und zu pflegen, sondern auch weitere Informationen anzubieten. Dazu zählen vor allem Fragen des Urheber-, Verwertungs- und Leistungsschutzrechtes sowie der Lizensierung von geistigem Eigentum. Die Deutsche Digitale Bibliothek wird und muss sich hier eng an die vergleichsweise strengen Vorgaben des deutschen Rechts halten.
Trotz solcher möglichen Einschränkungen wird die Deutsche Digitale Bibliothek der zentrale Nachweisort für Digitalisate aus deutschen Kultur- und Wissenschaftseinrichtungen sein und somit ältere Plattformen vergleichbarer Art ablösen.