Um die Fülle an Informtationen und Diensten im World Wide Web (WWW) effizienter nutzen zu können, wird intensiv an Technologien geforscht, die eine Berücksichtigung des Bedeutungsgehalts von Objekten im WWW ermöglichen. Sie reichen von der Einigung auf inhaltliche Beschreibungsstandards bis zur Vision eines "Semantic Web", welches die rechnerbasierte Verarbeitung und Interpretation von Informationen erlaubt. Allen Ansätzen ist gemeinsam, dass sie die Auszeichnung der Webressourcen mit den für die jeweilige Technologie relevanten Metadaten voraussetzen. Eine besondere Bedeutung kommt in diesem Zusammenhang kontrollierten Vokabularen zu, die eindeutige und einheitliche repräsentative Einheiten für die Metadatenbeschreibung zur Verfügung stellen. Diese Arbeit gibt einen Überblick über die bedeutendsten aktuellen Vorschläge zu einer semantischen Nutzung des WWW und stellt das Konzept der kontrollierten Vokabulare vor. Am Beispiel der Schlagwortnormdatei, einem Thesaurus aus dem deutschsprachigen, wissenschaftlichen Bibliotheksbereich, wird aufgezeigt, wie ein kontrolliertes Vokabular für die Online-Erschließung im WWW genutzt werden kann.
Diese Masterarbeit wurde von Michael Bohner im Mai 2002 an der Univerität Konstanz, Fachbereich Informatik und Informtationswissenschaft, Studienfach Information Engineering, vorgelegt.
Als überregional bedeutendes, kulturhistorisches Museum besitzt das 1919 im Karlsruher Schloss gegründete Badische Landesmuseum (BLM) sehr umfangreiche Bestände aus verschiedensten Sammlungsgebieten. Zu den wichtigsten Sammlungen gehören:
die Ur- und Frühgeschichte, die antiken Kulturen des Mittelmeerraumes, die Sammlungen der Markgrafen von Baden, die Türkenbeute, die Kunst- und Wunderkammer, die Badische Landesgeschichte, das Münzkabinett sowie die Sammlung Angewandte Kunst seit 1900.
Seit Herbst 2001 setzt das BLM zur Dokumentation seiner Sammlungen eine Objektdatenbank ein. In der Datenbank werden sowohl Neuerwerbungen als auch Altbestände erfasst. Aktuell (Stand: 31. März 2005) umfasst die Objektdatenbank des BLM rund 22.000 Objektdatensätze und etwa ebenso viele, mit den zugehörigen Objektdatensätzen verknüpfte Bilddatensätze. Mit diesen Bilddateien werden gleichzeitig die Bestände an Negativen und Dias des Bildarchivs im Rahmen der Objektdatenbank katalogisiert. Mehr und mehr wird die Objektdatenbank alltägliches Arbeitsinstrument für die MitarbeiterInnen des BLM.
Als Mitglied des MusIS-Netzwerkes (MusIS = Museums-Informations-System) der Landesmuseen in Baden-Württemberg setzt das BLM die Software IMDAS-pro ein (derzeit: Version 2.5). Das BLM hat das Bibliotheksservice Zentrum Konstanz (BSZ) mit der Administration seiner Objektdatenbank betraut, das eine professionelle datentechnische (Datensicherheit!) und sachliche Betreuung (Administration etc.) gewährleistet. Als Leiterin des Referats Dokumentation ist die Verfasserin im BLM verantwortlich für die Strukturierung der Datenbank, für die Pflege der Normdaten sowie für Schulung und Betreuung der derzeit rund zwanzig NutzerInnen (Mitarbeiterinnen des Referats Dokumentation, FachwissenschaftlerInnen, RestauratorInnen, MitarbeiterInnen des Bildarchivs).
In den Museen gab es traditionsgemäß keinerlei terminologische Kontrolle für die handschriftlich ausgefertigten Inventarkarten. Objektbezeichnungen und verschiedene Sachzusammenhänge (Künstlernamen, Herstellungsort, Material, Technik etc.) wurden nach dem jeweils individuellen Stil der Wissenschaftlerin / des Wissenschaftlers benannt. Dagegen setzt eine Objektdatenbank in ihren Thesauri und Stammdatenlisten den Einsatz einheitlicher Benennungen in Form von Normdaten unbedingt voraus. Alle NutzerInnen der Datenbank müssen auf die Verwendung von Normdaten verpflichtet werden. Als Nutzen eröffnet sich für sie die Möglichkeit, die Recherche-Funktion der Datenbank umfassend einzusetzen und somit rasch auf alle in der Datenbank abgelegten Fakten zuzugreifen.
Die Schlagwortnormdatei stellt den gemeinsam gepflegten Thesaurus für die verbale kooperative Sacherschließung der wissenschaftlichen Bibliotheken im deutschsprachigen Raum dar. Für die Metadatenerschließung von Online-Publikationen durch die Verfasser selbst muß sie in geeigneter Weise im Internet zur Verfügung gestellt werden. Diese Lücke schließt dieses Projekt: die bislang nur in bibliothekarischen Eigenformaten angebotene Normdatei wird in einer WWW-fähigen Form aktuell, vollständig und komfortabel recherchierbar angeboten. Die technische Realisierung beruht auf SunOS als Betriebssystem, einer CGI-Schnittstelle, Perl als Programmiersprache und MySQL als unterlegtes relationale Datenbanksystem. Alternativen der Programmierung (JAVA etc.) werden dargestellt.
Inhalt:
- Das Institut für Museumsforschung
- www.museumsbund.de, Fachgruppe Dokumentation
- Fachvokabular und Dokumentation ist Teil unserer Alltagsarbeit
- Fachvokabular und Dokumentation im Museum
- Dokumentation
- Fachvokabular im Museum
- DHM-Suchmaske
- Bildindex und DISKUS: eine Datenbank für Kunst und Architektur
- Mindeststandards in der Museumsdokumentation
- Objekt ID Checkliste
- Vokabular
- Semiotisches Dreieck
- Monohierarchie, Polyhierarchie
- Kooperation
- Hilfe bei Objekterfassung und Retrieval
- Trachsler
- Hessischer Museumsverband
- Museumsvokabular.de
- SWD
Inhalt:
- Unterschiedliche Aufgabenstellungen von Bibliotheken, Archiven und Museen
- Inhalt des Portals: Grundinformationen und Erschliessungsdaten
- Bibliotheksbestände
- Archivbestände
- Konzeption des Gemeinsamen Internetportals
- Informationsebenen
- Kurzführer
- Beispiel Online-Beständeübersicht
- Präsentationsmodelle
- Gemeinsame Schnittmenge "Industrialisierung"
- Beispiel Dampfmaschine
- Beispiel einer Liste mit Links auf Erschließungsdatensätze
- Beispiel: Sprung in ein Online-Findmittel
- Beispiel Sprung in Online-Findbuch (StAL E 170a)
- Datenaustauschformat
- Verwendung von Normdaten
- Zusammenfassung: BAM aus der Sicht der LAD
- Verortung von Suchmaschinen-"Treffern"
Naturkundliche Sammlungen sind über Jahrhunderte mit großem Aufwand aufgebaut und bewahrt worden. Sie bilden das Rückgrad der systematischen Forschung und dienen als Datengrundlage für die Biodiversitätsforschung insgesamt. Mit der Entwicklung des BioCASE-Netzwerks ist es erstmalig in Europa gelungen, ein voll funktionsfähiges fach- und länderübergreifendes Netzwerk für Sammlungsinformation zur Verfügung zu stellen.
Über BioCASE sind gegenwärtig Informationen zu 15.000 Sammlungen und mehr als 5 Millionen Sammlungsobjekten verfügbar. Der BioCASE Datenservice ist gleichzeitig Teil der „Global Biodiversity Information Facility“ (GBIF), dem im Aufbau befindlichen weltweiten Netzwerk für Biodiversitätsdaten, über das bis heute über 70 Millionen biologische Sammlungsobjekte zugänglich gemacht wurden.
Die in naturkundlichen Sammlungen weltweit vorhandenen biologische Sammlungsobjekte werden auf 2,5 Milliarden geschätzt (Duckworth & al. 1993), nur ein Bruchteil hiervon ist bisher elektronisch erfasst, und von diesen ist wiederum nur ein Teil über elektronische Netzwerke verfügbar gemacht worden. Wissenschaftlichen Arbeiten über taxonomische Gruppen geht daher häufig eine aufwändige Recherche über das Vorhandensein von Belegen in Sammlungen voraus, die dann ausgeliehen oder vor Ort in Augenschein genommen werden müssen.
Mit der Digitalisierung und Vernetzung von Beleginformationen lässt sich der Rechercheaufwand wesentlich reduzieren, und hochauflösende digitale Belege können in vielen Fällen die Analyse des physischen Objekts erübrigen. Darüber hinaus eröffnen sich durch die Sammlungsvernetzung eine Vielzahl neuer Forschungsbereiche, die erst durch die schnelle Verfügbarkeit großer Mengen von Beleginformationen sinnvolle Ergebnisse liefern können. So wird zum Beispiel die Vorhersage der Verbreitung bestimmter Arten basierend auf Funden aus naturhistorischen Sammlungen verknüpft mit historischen Klimadaten erst aussagekräftig, wenn eine möglichst hohe Anzahl von Sammlungsinformationen für die untersuchten Arten über Netzwerke abgefragt und gemeinsam analysiert werden können.
Inhalt:
- Datenbestände
- Rahmenbedingungen
- Suchoptionen
- Erschließungsmethoden
- Inhalt der Erschließungsdaten
- Variationen der Ansetzungen in den Erschließungsdaten
- Zeitspannendefinitionen
- Personennamen
- Ansetzung von Ortsnamen
- Sachschlagwörter
- Plädoyer für Normdaten
- Teilnahmen von Archiven und Museen an der SWD
- Automatische Indexierung
- Bewertung der Schlagwörter
- Normdatennutzung bei Anfragen
- Datenformate
- Datenfelder: BAM
- IMDAS-Pro
- Dateneinbindung
- Ergebnis
- Ergebnisanzeige
- Detailansicht 1 und 2
- Sammlungsgeschichte
- Individualiserter Zugang
Since several years it has been observed that information offered by different know-ledge producing institutions on the internet is more and more interlinked. This tendency will increase, because the fragmented information offers on the internet make the retrieval of information difficult or even impossible. At the same time the quantity of information offered on the internet grows exponentially in Europe – and elsewhere - due to many digitization projects. Inasfar as funding institutions base the acceptance of projects on the observation of certain documentation standards the knowledge created will be retrievable and will remain so for a long time. Otherwise the retrieval of information will become a matter of chance due to the limits of fragmented, knowledge producing social groups.
Der Vortrag stellt die neue Gesamteinspielung der RVK in den SWB vor. Dabei wurden stabile Identnummern für die RVK-Notationen von der UB Regensburg vergeben und in den SWB übernommen. Des weiteren wird die Versorgung des Digitalen Assistenten BW für die Sacherschließung mit Titeln aus der SWB-Verbunddatenbank und der Rückimport der vergebenen Schlagworte in die SWB-Verbunddatenbank thematisiert.
Für Monographien des FID Theologie wird ein neuer Service aufgebaut, der semi-automatisch relevante Publikationen aus dem Fremddatenbereich (Nationalbibliographien, Verbundkataloge, Großbuchhändler) in die Fachbibliographie einspielen wird. Die bislang lokal geführten Normdaten für die Sacherschließung der theologischen Literatur sowie Personennormdaten wurden an das GND-Format und das neue Regelwerk angepasst und eingespielt.
Normierung ist allgemein ein nützliches Instrument der formalen und inhaltlichen Dokument- und Medienbeschreibung. Aus diesem Grund werden in der bibliothekarischen Formal- und Inhaltserschließung zentrale Beschreibungselemente über sog. Normdateien kontrolliert, die über die Festlegung von Ansetzungsformen die einheitliche Beschreibung sichern, gleichzeitig durch die Bereitstellung von Nicht-Ansetzungsformen (Verweisungsformen) die Suche auch mit nicht bevorzugten Schreibweisen unterstützen (Synonymen).
Normierungselemente in der bibliothekarischen Formalerschließung sind Verfassernamen, Körperschaften, in der Inhaltserschließung sind es Schlagwörter. Die gemeinsame Verwendung der Normdateien in Verbindung mit einem einheitlichen Erfassungsstandard (RAK) bzw. einem Quasi-Erschließungsstandard (RSWK) erleichtert die Datenübernahme und führt zu verlässlichen Erschließungs und Katalogumgebungen.
Für die Erschließung nicht-textlicher Objekte hat sich eine derartige Rahmenumgebung bislang nicht entwickelt. Objektdokumentation im musealen Bereich und Bilddokumentation in der Kunstgeschichte erfolgen nach jeweils lokalen Richtlinien, ein Rückgriff auf gemeinsame Erschließungsressourcen (z.B. Normdateien) ist nicht möglich, weil diese entweder nicht existieren oder existierende nicht allgemein genutzt werden. Der Wunsch nach „normenden Instanzen“, mindestens aber nach einer Verständigung auf gemeinsame Standards wächst, allerdings ist es höchst unwahrscheinlich, dass sich die große Zahl sehr heterogener Erschließungswelten in ein gemeinsames Konzept bringen lässt.
Realistischer ist es, von der existierenden Vielfalt auszugehen und Anstrengungen zu unternehmen, die Vielfalt nicht zum Problem werden zu lassen. Dies bedeutet in erster Linie, Versuche zu unternehmen, unterschiedliche Beschreibungsdaten, die aber das Gleiche meinen, mit maschineller Hilfe zusammenzubringen.
Dieser Beitrag versucht, für derartige Ansätze die Möglichkeiten und Grenzen des automatisch Machbaren aufzuzeigen.
Die Sacherschließung in Museen sollte mithilfe von kontrolliertem Vokabular vonstatten gehen. Ich stelle in diesem Text ein im Bibliotheksservice-Zentrum Baden-Württemberg (BSZ) erarbeitetes Instrument vor: den Objektbezeichnungsthesaurus des BSZ. Im ersten allgemeinen Teil wird kurz erläutert, was ein Thesaurus ist und welche Probleme sich bei dessen Erstellung ergeben können. Dem schließt sich ein Blick auf die momentane Ausgangslage im deutschsprachigen Museumsbereich an, bevor im Hauptteil dezidiert auf den Objektbezeichnungsthesaurus des BSZ eingegangen wird.
Was ist ein Thesaurus? Thesaurus klingt wie eine Figur aus der griechischen Mythologie, wie eine Mischung aus Theseus und Minotaurus. Der Minotaurus war ein Ungeheuer, halb Mensch, halb Stier, das in einem Labyrinth lebte und schließlich vom Helden Theseus erlegt wurde. Aus dem Labyrinth kam Theseus jedoch nur wieder heraus, weil ihm die kluge Ariadne zuvor ein Wollknäuel in die Hand gegeben hatte, das er beim Hineingehen abwickeln konnte und das ihm so half, später wieder den Weg heraus zu finden. Der Begriff Thesaurus stammt ebenfalls aus dem Griechischen und wird im Sinne von Wortschatz übersetzt. Oder um es genauer zu sagen: „Ein Thesaurus […] ist eine geordnete Zusammenstellung von Begriffen und ihren […] Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient.“ Zweck eines Thesaurus ist es, Beziehungen zwischen Begriffen und ihren Bezeichnungen herzustellen, um das Begriffsumfeld zu bestimmen und damit die einzelnen Begriffe zu vereindeutigen. Zugleich dient ein Thesaurus der terminologischen Kontrolle in einem Fachgebiet. Oder, um in der griechischen Mythologie zu bleiben: ein Thesaurus ist der rote Faden der Ariadne, um in einem unübersichtlichen Labyrinth den Überblick zu behalten.