17.04.2024 | Team OA Brandenburg

OA-Interviews: Tobias Steiner (Thoth Open Metadata) über Trends und Lösungen für Open Access-Bücher.

Wie auch unsere Arbeit mit der Open Access Community im Land Brandenburg zeigt, besteht ein großer Bedarf die Förder- und Infrastrukturen für Open-Access-Bücher nachhaltiger zu gestalten. Bei den Open-Access-Tagen im vergangenen Jahr gewann Tobias Steiner den Preis für bestes Design für sein Poster „Thoth Open Metadata Management and Distribution Service for OA Books“ (DOI: 10.5281/zenodo.8273948). Spätestens damit zog er enorme Aufmerksamkeit auf sein Projekt Thoth Open Metadata. Grund genug, für uns einmal nachzufragen, was sich dahinter verbirgt.  

Das Interview führte Sharon Hundehege, studentische Mitarbeiterin in der Vernetzungs- und Kompetenzstelle Open Access Brandenburg. 

1) Würden Sie sich bitte kurz vorstellen? Welche Aufgabe(n) haben Sie bei Thoth Open Metadata?  

Tobias Steiner: Ich bin seit fast einem Jahr Chief Operating Officer (COO) und Product Manager des Projekt-Spin-Offs Thoth Open Metadata und damit die zentrale Ansprechperson, die einen Blick auf die Implementierung der größeren strategischen Zielsetzungen und grundlegenden Ausrichtung des operativen Geschäfts hat. Dabei arbeite ich eng mit den drei Direktoren Joe Deville, Rupert Gatti und Vincent van Gerven Oei, unseren Entwicklern Javier Arias, Ross Higman und Brendan O’Connell sowie den beiden Outreach-Kolleginnen Amanda Ramalho und Hannah Hillen zusammen.  

Konkret knüpfe ich beispielsweise Kontakte zu neuen Stakeholdern wie Verlagen oder Plattformen, kümmere mich um die Gestaltung von Kooperationsvereinbarungen und decke zentrale administrative Bereiche wie das Reporting und Management im Kontext des Open Book Futures-Projekts ab. Hierbei helfen mir die im Vorgänger-Projekt Community-led Open Publication Infrastructures for Monographs (COPIM) gemachten Erfahrungen, für das ich von 2020 bis 2023 zentraler Projektmanager war. 

2) COPIM widmete sich der Fragestellung, wie ein alternatives, gemeindegeleitetes und nicht profitorientiertes Publikationsökosystem für Geistes- und Sozialwissenschaften gestaltet werden kann. Dabei wurden verschiedene Aspekte wie nachhaltige Finanzierung, gemeinschaftliche Governance und experimentelles Publishing untersucht. Ein spezifisches Unterprojekt konzentrierte sich auf die Integration von Open-Access-Büchern in bestehende Disseminationsplattformen und identifizierte Hindernisse insbesondere für kleine Verlage. Die Hindernisse umfassen begrenzte Ressourcen, mangelnde Expertise bei der Metadatenerstellung und eine fragmentierte Disseminationslandschaft, die primär auf kommerzielle Plattformen ausgerichtet ist. Thoth Open Metadata als Antwort auf diese Herausforderungen als offenes Disseminationssystem gedacht, das auf offenen Standards basiert. Es soll konkret die Sichtbarkeit von Open-Access-Büchern verbessern. Warum ist das notwendig? Und wie will Thoth das erreichen?  

Tobias Steiner: Thoth ist als One-Stop-Shop zur Generierung und Dissemination von offenen Metadaten für Open-Access-Bücher konzipiert. Verlage können ihre Metadaten sowohl für Bücher als auch für Einzelkapitel über ein zentrales Webinterface und mit verschiedenen offenen Identifiern zu Beitragenden (mittels ORCID-Integration) Institutionen und Förderorganisationen (mittels ROR-Integration) sowie Klassifikationsstandards (z.B. BISAC, Thema) erfassen und anreichern. Auch der Import bestehender Kataloge ist möglich.  

Sobald die Metadaten-Einträge im System vorhanden sind, können zahlreiche Export-Formate in verschiedenen plattform-spezifischen Spezifikationen vollautomatisch genieren lassen. Beispiele sind ONIX 3.0 für OAPEN, ONIX 2.1 für EBSCO Host oder Google Books, ein spezifisch für Crossref-Deposits optimiertes XML und MARC21-Exporte zur Integration in Bibliothekskataloge.  

Der gesamte Datensatz ist direkt über offene APIs ansprechbar, kann also direkt abgerufen werden Er ermöglicht so beispielsweise die Generierung von vollständigen Katalogen einzelner Verlage oder eine Zusammenstellung verschiedener Verlagskataloge in Sammelkatalogen. 

Diese Integration des offener Datenstrukturen ist bereits durch die aus COPIM entstandene Schwester-Initiative Open Book Collective in einem Konsortialkatalog umgesetzt. Der scholar-led Verlag Open Book Publishers generiert beispielsweise seinen gesamten Katalog live aus dem Thoth-Datensatz und speist entsprechende Teilinformationen auf Buchebene wie Lizenzierung, Beschreibung, Beitragende, Download-Links für Einzel-Kapitel etc. ebenfalls direkt aus Thoth ein. 

Die Entscheidung zur Entwicklung von Thoth wurde durch die aktive Einbindung mehrere kleiner scholar-led Verlage motiviert, die in COPIM und im Open Book Futures-Projekt eine zentrale Rolle spielen. Die gemeinsamen Erfahrungen der beteiligten Verlage und des Projektteams erwies sich bei der Entwicklung des offenen Disseminationssystems als ungeheuer wertvoll, da das Team direkt die Hindernisse adressieren konnten, die die Verlage aufzeigten.  

Das Feedback ermutigte uns auch, weitergehende Services – unter dem Label Thoth Plus – in das Angebot aufzunehmen. Mit diesem Paid-Service-Angebot bieten wir Verlagen gegen Entrichtung eines Unkostenbeitrags unter anderem die direkt plattformübergreifende Dissemination und die Erstellung von Metadaten für die Bücher durch Thoth an. Damit ermöglichen wir den Verlagen, eine stärkere Fokussierung auf ihr eigentliches Kerngeschäft: das Publizieren von Büchern. 

Neben dem Servicegedanken an sich ist hier auch ein in COPIM und Open Book Futures durch alle Stakeholder vertretenes Grundverständnis zentral: Wir denken, dass Open Access nur konsequent realisiert werden kann, wenn auch auf die zugrundeliegende Infrastruktur offen bereitgestellt wird (siehe hierzu bspw. Bilder et. al 2015, COPIM 2021, Suber 2021).  

Für Thoth bedeutete dies in der Konsequenz, das System vollständig als Open-Source-Plattform zu entwickeln. Die Bereitstellung der über die Plattform generierten Metadaten erfolgt mittels einer CC0 (Public Domain Dedication) Lizenz. Damit setzen wir etablierte Open Data Best Practices um und ermöglichen die unmittelbare Weiternutzung sowie Remixing der Daten. Durch die automatische Bereitstellung qualitativ hochwertiger MARC-Daten erleichtert Thoth auch Bibliotheken die Nachnutzung von Publikationsdaten (siehe hierzu bspw. Edmunds 2023). 

Grundsätzlich wollen wir durch Thoth einen wichtigen Beitrag zu einem komplett offenen Disseminationsökosystem leisten. Dadurch, dass alle generierten Metadaten unter CC0 verfügbar sind, können andere Infrastrukturen darauf aufbauen und eigene Produkte und Services entwickeln. Denkbar ist beispielsweise die Nutzung der Daten für datenschutzkonforme, auf Quelldaten basierende Nutzungsstatistiken. Hierzu stehen wir im engen Austausch mit Kolleg*innen von OAPEN und DOAB, dem Books Analytics Dashboard der Curtin Open Knowledge Initative sowie dem Open Access eBook Usage Data Trust (OAeBU DT). Mit Blick auf unsere Zusammenarbeit mit wissenschaftlichen Bibliotheken wäre eine weitere Option, mit der Zeit eine wirklich offene Alternative zu bestehenden internationalen Buchkatalogen zu etablieren. 

3) Die Thoth-Open Metadata-Plattform wird in Großbritannien entwickelt. Sie spricht explizit kleinere scholar-led Verlage an. Wie ist das bisherige Feedback der Verleger*innen in UK zu der Plattform? Wie wird das Konzept von ihnen angenommen?   

Tobias Steiner: Thoth wurde in England formal als non-profit Community Interest Company (ähnlich einer gGmbH) registriert. Wir arbeiten aber mit Verlagen aus der ganzen Welt und sind stolz darauf. Auch wenn unser Fokus auf kleinen und scholar-led Verlagen liegt, steht Thoth prinzipiell allen Verlagen kleiner und mittlerer Größe offen. Die mehr als 25 Verlage, mit denen wir aktuell zusammenarbeiten, umfassen kleine und scholar-led Verlage aus Südafrika, Deutschland, der Schweiz, Ungarn, USA, Lateinamerika (über eine enge Kooperation mit SciELO Books) und UK. Auch Universitätsverlage aus England, Schottland und Belgien nutzen Thoth bereits. Derzeit stehen wir zudem im Gespräch mit mehreren niederländischen Universitätsverlagen. 

Uns ist es wichtig, Thoth in enger Kooperation mit den beteiligten Verlagen weiterzuentwickeln. Das Feedback ist durchwegs positiv – so bedankten sich beispielsweise mehrere Verlage explizit dafür, dass sie nun nicht mehr auf Excel-Spreadsheets zurückgreifen und diese manuell anpassen müssen, was ihnen viel Aufwand und Zeit spart.  

Interessant ist auch, dass vielen Beteiligten durch die Beschäftigung mit Thoth erstmals klar wird, wie komplex, fragmentiert und undurchsichtig die Landschaft des Publikationsmarktes eigentlich ist. Die offene Bereitstellung von Informationen im Thoth Wiki wird regelmäßig als für die Verlage höchst wertvolle Ressource genannt, da sie ihnen eine informierte Entscheidungsfindung bezüglich der Auswahl an Disseminationskanälen deutlich erleichtert. (Weitere Details zum Verlags-Feedback finden sich beispielsweise in Snyder et. al 2023 und Steiner et. al 2023.) 

Zugleich wird in Zusammenarbeit mit den Stakeholdern sichtbar, wie unterschiedlich die Bedarfe der einzelnen Verlage sind. So nutzen manche Universitätsverlage schon länger kommerzielle Titelmanagementsysteme wie Consonance, woraus sich im Vergleich zu kleinen und scholar-led Verlagen andere Anschluss-Fragestellungen ergeben. Für Universitätsverlage ist Thoth hier insbesondere interessant, da Thoth – im Gegensatz zu vielen anderen Titelmanagementsystemen – auch die Metadaten-Erfassung auf Kapitelebene ermöglicht und zahlreiche im Open Science-Kontext relevante PIDs wie ROR und ORCID abdeckt, die anderswo noch fehlen.  

4) Inwiefern verbesserte sich die Sichtbarkeit von Open-Access-Büchern in bestehende Nachweissysteme und Verbreitungskanäle bereits? Gibt es vielleicht schon „Erfolgsstories“?   

Tobias Steiner: Wir konnten in den vergangenen Monaten bereits einige wichtige Meilensteine erreichen. So wurde Thoth im Dezember 2023 als offizieller Crossref-Sponsor bestätigt. Durch das nun durch Thoth vermittelte Sponsorship insbesondere für kleine und scholar-led Verlage mit begrenzten finanziellen und administrativen Kapazitäten werden teilnehmenden Verlagen die Crossref-Jahresgrundbeiträge erlassen. Auch die bei einer Registrierung einzelner DOIs anfallenden Kosten werden vollständig durch Thoth getragen.  

Verlage profitieren bei der Nutzung von Thoth Plus auch vom vollautomatisierten Registrierungs-Workflow, der direkt neue DOIs für Bücher und Kapitel registriert oder bestehende DOIs aktualisiert. Alternativ können die Verlage bereitgestellte und auf Crossref-Spezifikationen optimierte XML-Metadaten nutzen, um die Registrierung von DOIs selbst anzustoßen. (mehr dazu siehe Arias et. al, 2024). 

Ein weiterer Erfolg ist die langjährige enge Kooperation zwischen Thoth und OAPEN, die durch ein Service Agreement und die Aufnahme von Thoth in das DOAB Trusted Platform Network auf eine neue Ebene gehoben wurde. Mit dem im Januar unterzeichneten Service Agreement profitieren durch Thoth vertretene Verlage – ähnlich wie beim Crossref Sponsorship – von den ausgehandelten Konditionen. Beispielsweise werden die Servicegebühren von OAPEN in diesem Fall ausgesetzt. Zudem arbeiten die Teams von Thoth und OAPEN aktuell an gemeinsamen Workflows zur verbesserten Übermittlung von Metadaten zwischen Thoth, OAPEN und dem Directory of Open Access Books. Auch davon profitieren die Verlage direkt. Die enge Kooperation zwischen OAPEN, DOAB und Thoth wird mittlerweile im durch das DOAB vergebene Qualitätssiegel der DOAB Trusted Platform sichtbar. 

Bei der Langzeitarchivierung von Open Access-Büchern wurden wichtige Implementierungsschritte erzielt. So etablierten wir einen Workflow, der dafür sorgt, dass die Gesamtkataloge der Verlage punctum books und Open Book Publishers über Thoth automatisch im Internet Archive hinterlegt und sukzessive aktualisiert werden. Damit wurde ein Weg gefunden, die längerfristige Archivierung von Open Access-Büchern mittels einer Ein-Knopf-Lösung sicherzustellen. Aktuell wird im Thoth Archiving Network daran gearbeitet, den Ansatz auf weitere Archivierungsplattformen und Repositorien zu erweitern, um – ganz dem LOCKSS-Prinzip folgend – mehrere technisch unabhängige Archivierungslösungen zu etablieren. Dieses Angebot werden wir in den kommenden Wochen auf weitere interessierte Verlage ausweiten. 

5) Wie sehen Sie die Chancen von Thoth in Deutschland? Wer wäre hier die Zielgruppe? Wie sieht ein Zeitplan für die Implementierung des Angebots aus? Welches Ziel verfolgte das ENABLE!-Werkstattgespräch in dieser Hinsicht?  

Tobias Steiner: Thoth richtet sich generell an alle Verlage kleiner und mittlerer Größe, die entweder schon voll auf Open Access für ihre Bücher setzen (sog. „born-OA“ Verlage), oder als Verlage mit Hybridmodell interessiert sind, ihr Portfolio perspektivisch auf Open Access umzustellen.  

Dies schließt selbstverständlich deutsche Verlage ein. Tatsächlich arbeiten wir bereits mit zwei deutschen Verlagen zusammen.  

Das ENABLE!-Werkstattgespräch war primär als Erstinformationsangebot gedacht, um die in der Community aktiven Stakeholder auf unseren Service und die Thoth-Plattform aufmerksam zu machen. Erfreulicherweise folgten auf das Werkstattgespräch auch direkte Anfragen. Wir erörtern aktuell innerhalb des Thoth-Teams, wie wir weitere, speziell für Deutschland relevante Disseminationsplattformen in unser Angebot aufnehmen können, um deutsche Verlage zu unterstützen. 

6) Wenn wir es richtig verstehen, finanziert sich Thoth zweigleisig: einmal über Zahlungen der Publisher mit verschiedenen Service Levels  und zum anderen über finanzielle Unterstützungsbeiträge aus der Community, wobei die Zahlungen über Open Book Collectiveabgewickelt werden. Wie sind die Erfahrungen damit? 

Tobias Steiner: Als kleines Non-profit sind wir darauf angewiesen, unterschiedliche Einnahmeströme zu etablieren, um die grundlegenden Betriebskosten des Infrastrukturangebotes auch längerfristig decken zu können.  

Aktuell erhält Thoth als einer der zentralen Stakeholder im Open Book Futures-Projekt bis 2026 finanzielle Unterstützung durch die beiden Förderorganisationen Arcadia und Research England Development Fund (UKRI), um die in COPIM entwickelten Proof of Concept-Infrastrukturen – einschließlich Thoth – auf eigene Beine zu stellen. Dank der Projektförderung kann sich Thoth aktuell vollkommen auf die Etablierung des Service-Angebots sowie die Ausweitung der Kollaborationen mit anderen offenen Infrastrukturanbietern konzentrieren. 

Eine enge Verbindung besteht hier zwischen Thoth und der auch aus dem COPIM-Projekt heraus entwickelten Schwester-Initiative Open Book Collective (OBC). So wird der OBC-Gesamtkatalog direkt aus der Thoth-Datenbank gespeist, weshalb wir allen im Open Book Collective vertretenen Verlagen auch eine Nutzung von Thoth nahelegen.  

Auf der anderen Seite werden interessierte Bibliotheken eingeladen, offene Infrastruktur-Serviceanbieter, zu denen neben Thoth auch OAPEN und DOAB gehören, über eine Mitgliedschaft in der Open Book Collective finanziell zu unterstützen. Die Option des Pledgings einer finanziellen Unterstützung über ein oder mehrere Jahre gibt es seit 10 Monaten (siehe hierzu den jüngst veröffentlichten ersten OBC Annual Review) und wir freuen uns über die sehr positive Resonanz internationaler und auch deutscher Bibliotheken.  

Es muss aber auch erwähnt werden, dass wir erst am Anfang des Weges stehen, unsere verschiedenen Einnahmeströme zu etablieren und dementsprechend aktuell noch nicht vollständig ausfinanziert sind. Das vor gut einem Monat eingeführte Service-Modell von Thoth Plus, ist daher als weiteres wichtiges Standbein gedacht, um mittelfristig unabhängig von Projektförderungen agieren zu können.  

Wir danken Ihnen für das Gespräch!