...
German | ||||||
---|---|---|---|---|---|---|
Inhalt
XML-Schema und ausführliche Dokumentationhttps://github.com/DARIAH-DE/DCDDM EinleitungDas DARIAH Collection Description Data Model (DCDDM) ist, schlicht gesagt, ein Datenmodell für Sammlungsbeschreibungen. Es wurde in Zusammenarbeit mit der Herzog August Bibliothek Wolfenbüttel (HAB) entwickelt und basiert in seinen Grundzügen auf dem Dublin Core Collections Application Profile (DCCAP). Das Hauptziel bei der Erstellung des DCDDM lag in der Unterstützung von Institutionen und EinzelwissenschaftlerInnen bei der Erstellung von Beschreibungen von physikalischen (und/oder analogen) UND digitalen Sammlungen, die sowohl von Menschen als auch maschinell gelesen und interpretiert werden können. Das DCDDM gibt eine feste Anzahl von Klassen, Elementen, Attributen und Werten an, die für die Beschreibung von Sammlungen verwendet werden können. Nach der Definition des Dublin Core ist eine Kollektion “eine Aggregation von Ressourcen“. Bei diesen Ressourcen kann es sich um digitale Objekte wie digitalisierte Gemälde, Bücher, Manuskripte sowie “born-digital objects” handeln wie bspw. Aufzeichnungen von Metadaten, Datenbankinhalte oder Transkripte, aber auch um physische Objekte (Gemälde, Bücher, Statuen, Briefmarken, Münzen usw.) Es ist jedoch nicht immer leicht zu erkennen, was genau die Ressourcen einer Sammlung überhaupt sind. Nehmen wir zum Beispiel eine Sammlung von frühen gedruckten Büchern, deren Metadaten gesammelt und veröffentlicht werden durch einen Online Public Access Catalog (OPAC). Durch die Beschreibung dieses OPAC-Eintrags wird eine Sammlung von (physischen) Büchern oder die Sammlung der jeweiligen Metadaten (Autor, Erscheinungsjahr, Seitenzahl, Unterschrift etc.) definiert. Auf der einen Seite stehen die gemeinsamen Benutzer eines OPAC, die vor allem (wenn nicht sogar ausschließlich) an dem physischen Objekt interessiert sind. Sie würden vermutlich danach suchen, wann die Bücher veröffentlicht oder erstellt wurden und an dem Datum der Erstellung der Metadatensätze eher nicht interessiert sein. Entsprechend des Interesses des Nutzers werden bereitgestellte Informationen also anders wahrgenommen und genutzt. Die Frage stellt sich, wie der Zugang zu Informationen auf NutzerInnen zugeschnitten werden kann, ohne vorher zu wissen, wie Sammlungsbeschreibungen genutzt werden und für welchen Zweck. Eines der Hauptziele des DCDDM ist es, dieses Problem zu lösen, indem die Möglichkeit geboten wird, so viele (sinnvolle) Informationen wie möglich in einer Sammlungsbeschreibung anzugeben. Eine weitere Herausforderung, die häufig schnell offensichtlich wird, ist das meist unklare oder nicht einheitliche Verständnis und der zugrunde liegenden Definitionen zu den Begriffen „Sammlung“ und „Sammlungsobjekt“ in den unterschiedlichen geistes- und kulturwissenschaftlichen Disziplinen. Darüber hinaus gibt es keine strikte Unterscheidung zwischen den Objekten der Sammlung (z. B. Bücher), den Metadaten der Objekten (z. B. Informationen über den Autor und den Titel) und den tatsächlichen Manifestationen dieser Informationen in Form von beispielsweise in der Datenbank gespeicherten Bit-Streams. Ein beträchtlicher Aspekt der Bereitstellung solcher breit gefächerten Informationen ist, dass der Prozess der Erfassung aller relevanten Informationen sehr zeitaufwendig sein kann. Nach den aktuellen Anforderungen des DCDDM kann man eine gültige Beschreibung erstellen, indem man nur rudimentäre Informationen hinzufügt. Dies bedeutet aber auch, dass eine Sammlungsbeschreibung in ihrem Detaillierungsgrad stark variieren kann (siehe Kapitel User-Guides und Nutzungsempfehlungen). Ein wichtiger Aspekt bei der Nutzung der Collection Registry und der Beschreibung von Sammlunge ist in dieser Hinsicht auch die Bereitschaft der NutzerInnen, Ressourcen zu investieren, um eine Sammlungsbeschreibung, die originär beispielsweise im Rahmen eines Forschungsvorhabens erstellt wurde, um dezidierte Fragestellungen abzubilden, mit den notwendigen Informationen für das generisch nachnutzbare DCDDM Metadatenprofil zu erweitern. Natürlich hängt dabei die Granularität und die Anzahl der bereitgestellten Informationen auch von der Sammlung selbst ab, den sammelnden Einrichtungen sowie der Infrastruktur, die Einrichtungen und Wissenschaftler zur Verfügung stehen. Um Sammlungen tiefer zu erschließen, ist weiterhin ein gewisses Maß an Know-How in Sachen Metadatenmanagement von Vorteil. Anforderungen und Ziele des DCDDM
|
English | ||||||
---|---|---|---|---|---|---|
Table of Contents
XMLSchemaschema and more documentationhttps://github.com/DARIAH-DE/DCDDM Introduction and design principlesThe DARIAH Collection Description Data Model (DCDDM) specifies a fixed number of classes, elements, attributes, and values used for describing collections. Following the definition of the Dublin Core a collection is “an aggregation of resources”, which can be digital objects like digitized paintings, books, manuscripts, as well as “born-digital” objects like records of metadata, database-entries, or transcripts) or physical ones (paintings, books, statues, stamps, coins, etc.). It is, however, not always so simple to identify what precisely the collection's resources are. Let´s take for instance a collection of early printed books where books' metadata are collected and made public by an “Online Public Access Catalogue” (OPAC). By describing this OPAC am I describing a collection of (physical) books or the collection of respective metadata (author, year of publication, number of pages, signature, …)? On the one hand we have the common user of an OPAC interested mainly, if not exclusively, in the physical object. He would search for the dates when the books were published (created) rather than look up the date of creation of the metadata records. On the other hand other users might want to harvest the books' metadata and would require therefore access to information about the metadata (for example the date when the metadata records have been created). So the interest of the users who are targeted by the OPAC influences the information the collection's description contains. But how can we tailor the user's access without knowing who is going to use our collection description and for which purposes? One of the main goals of the DCDDM is to address this issue by providing ways to pack as much information into one collection description as possible and reasonable. One of the challenges one encounters almost immediately is the most often unclear or not uniform understanding of the term 'collection' and collection’s items. Furthermore there is no strict differentiation between the collection's items (e.g. books), the item's metadata (e.g. the information about the author and title) and the actual manifestations of these information in form of, for instance, bitstreams saved in database. Another considerable aspect of providing such a broad range information is that the process of gathering all the relevant information can be very time consuming. Following the DCDDM requirements one can create a valid description by adding only a handful of basic information. This means, for example, that a given collection can have descriptions which vary strongly in their level of detail. A major factor in this respect is the descriptor's vision about the description and his or her willingness to invest time and effort to transform a valid but very basic collection description into a top notch collection description. On the other hand, the level of detail or number of providable information depends also on the collection itself, the collection´s items and the infrastructure which maintains the collection. Institutions, which have at its disposal sufficient personnel and funds, have better resources to describe in detail their collections, than would an independent scholar with his or her collection of notes made while writing a small article. Given the broad definition of collection and the consequently many possible varieties of collections, the DCDDM has to achieve the following objectives:
|