Page tree
Skip to end of metadata
Go to start of metadata

Mit dem DARIAH-DE Repository und dem TextGrid Repository steht Geistes- und KulturwissenschaftlerInnen ein umfassendes Angebot zur Verfügung, um ihre Forschungsdaten dauerhaft, nachnutzbar und referenzierbar zu speichern. Während das TextGrid Repository für XML/TEI-Formate sowie das editorische Arbeiten und die Publikation aus dem TextGrid Laboratory[1] optimiert ist, unterstützt das DARIAH-DE Repository[2] auch beliebige XML-fremde Datenformate und bietet einen Publikationsprozess über das DARIAH-DE Portal. Beide Repositorien basieren auf dem gleichen technologischen Framework, bieten jedoch – je nach Datenformat und Repository – unterschiedliche Modelle der Datenpräsentation und -kuration sowie Schnittstellen, um eine spezifische Nachnutzung ermöglichen zu können.

Beide Repositorien adressieren WissenschaftlerInnen an Universitäten und Forschungseinrichtungen, die in Forschungsprojekten entstandene Forschungsdaten langfristig im Rahmen einer Repository-Lösung speichern wollen.

Die Infrastruktur

Die Infrastruktur für das TextGrid Repository und das DARIAH-DE Repository wird von DARIAH-DE zur Verfügung gestellt und basiert auf Tools und Diensten des DARIAH-DE Developer-Portals und dem Quellcode von TextGrid und DARIAH-DE Kernkomponenten[3]. So werden zum Beispiel für die Entwicklung von Diensten beider Repositorys viele Tools für die Continuous Integration (GIT, Jenkins, Sonar, Nexus, Puppet, etc.) und Virtuelle Maschinen genutzt, wie auch das Monitoring der verschiedenen Dienste, deren Dokumentation im Wiki hinterlegt ist. Für die Projektverwaltung und das Bugtracking werden ebenfalls Angebote von DARIAH-DE genutzt.

Das Speicherbackend beider Repositorien besteht jeweils aus einem nicht-öffentlichen, zugriffsgeschützten und einem öffentlichen Bereich (OwnStorage/PublicStorage). Alle Dienste und Daten sind über die DARIAH Authentifizierungs- und Autorisierungs-Infrastruktur (AAI) abgesichert, so dass bestimmt und kontrolliert werden kann, wer welche Zugriffsrechte hat. Die Authentifizierung erfolgt via Shibboleth (eduGAIN), die Autorisierung via OpenLDAP/OpenRBAC. Die öffentlichen Daten beider Repositorien sind in der DARIAH-DE Collection Registry[4] verzeichnet und über die Generische Suche[5] auffindbar. Als zusätzliche Features stellt TextGrid eine Volltextsuche und eine rollenbasierte Autorisierung im OwnStorage über OpenRBAC bereit.

TextGrid Repository

Die Daten im TextGrid Repository werden mit einem spezifischen TextGrid-Metadatenschema[6] beschrieben. Der nicht-öffentliche Speicherbereich (OwnStorage) wird über ein Rollen- und Rechtemanagement administriert, der öffentlich zugängliche Speicherbereich (PublicStorage) enthält sämtliche publizierte Daten. Jede hier gespeicherte Datei erhält zu ihren dauerhaften Referenzierung einen Persistenten Identifikator (ePIC PID[7]). Alle öffentlichen Daten des TextGrid Repositorys sind über die Webseite des TextGrid Repository[8], über die TG-search API[9] sowie in der DARIAH-DE Generischen Suche recherchierbar und mithilfe verschiedener Tools – wie zum Beispiel Digivoy/Voyant – visualisierbar.

Zentraler Bereich der gemeinsamen Weiterentwicklung von TextGrid[10] und DARIAH-DE[11] ist das TextGrid Repository, das als geisteswissenschaftliches Forschungsdatenarchiv im Projekt TextGrid entwickelt wurde und nun von DARIAH-DE bereitgestellt wird. XML/TEI-Forschungsdaten können im TextGrid Laboratory als TextGrid-Objekte[12] gemeinsam bearbeitet, ausgezeichnet, angereichert und schließlich als Kollektion oder Edition publiziert werden. Auch ein direktes Publizieren von Daten im TextGrid Repository ist möglich – ohne die Nutzung des TextGrid Laboratory –, und erlaubt ebenso eine dauerhafte und referenzierbare Speicherung sämtlicher Daten in unterschiedlichen Formaten, wobei insbesondere die Präsentation von XML/TEI unterstützt wird.

DARIAH-DE Repository

Das DARIAH-DE Repository ermöglicht die dauerhafte und referenzierbare Speicherung von Forschungsdaten mithilfe standardisierter deskriptiver Metadaten. Ein Basis-Satz von Metadaten des Dublin Core Standards DC-Simple[13] ist ausreichend, um Forschungsdatenobjekte zu beschreiben und in das Repository einzuspielen. Wie auch im TextGrid Repository können Gruppen von Objekten als Kollektion zusammengefasst werden. Über eine grafische Oberfläche im DARIAH-DE Portal – den Publikator[14] – ist es möglich, Kollektionen zu definieren, zu beschreiben und diese samt ihrer zugehörigen Dateien mit Metadaten auszuzeichnen. Anschließend kann die Kollektion in das DARIAH-DE Repository eingespielt werden. Hier erhält jedes Objekt einen DOI[15] als Persistenten Identifikator und wird langfristig im Repository gespeichert. Nachdem die Kollektion in der DARIAH-DE Collection Registry registriert wurde, werden alle zu dieser Kollektion gehörigen Objekte in der DARIAH-DE Generischen Suche nachgewiesen.



[1] Vgl. Download TextGrid Laboratory, https://textgrid.de/download

[2] Vgl. DARIAH-DE Repository, https://de.dariah.eu/repository

[3] Vgl. TextGrid – Übersicht, https://projects.gwdg.de/projects/tg

[4] Vgl. DARIAH-DE Collection Registry, https://colreg.de.dariah.eu

[5] Vgl. DARIAH-DE Generic Search, https://search.de.dariah.eu

[7] Vgl. ePIC – Persistent Identifiers for eResearch, http://www.pidconsortium.eu/

[8] Vgl. Suche – TextGridRep, https://textgridrep.org

[9] Vgl. TG-search – TextGrid Repository 2016 Documentation, https://textgridlab.org/doc/services/submodules/tg-search/docs/index.html

[10] Vgl. TextGrid: Digital edieren – forschen – archivieren, https://textgrid.de

[11] Vgl. Digitale Geisteswissenschaften – DARIAH, https://de.dariah.eu

[12] Vgl. TextGrid Nutzerdokumentation – TextGrid-Objekte, https://wiki.de.dariah.eu/display/TextGrid/TextGrid+Objects

[13] Vgl. Dublin Core Metadata Element Set, Version 1.1, http://www.dublincore.org/documents/dces

[14] Vgl. DARIAH-DE Publikator, https://de.dariah.eu/publish

[15] Vgl. DataCite DOI, https://www.datacite.org/

 

  • No labels