Editorial

Wer hat die meistzitierten Daten?

Zitationsindex für Datensätze

editorial_bild

(5. Juli 2012) „Publish or perish“ – also, veröffentliche oder gehe unter – lautet bekanntermaßen die Devise im Wissenschaftsgeschäft. Gradmesser des Erfolges ist der Science Citation Index, der SCI. Er gibt an, wie oft eine Publikation durch andere zitiert wird. Das amerikanische Medienunternehmen Thomson Reuters geht jetzt noch einen Schritt weiter und kündigt einen Zitationsindex für Datensätze an. Was bringt ein solcher Index?

Den Prototyp der neuen Messlatte für wissenschaftliche Arbeiten stellte Thomson Reuters Ende Juni auf der American Library Association Conference im kalifornischen Anaheim vor. Im letzten Quartal dieses Jahres soll der „Data Citation Index“ (DCI) laut Thomson Reuters in die von ihm betriebene kostenpflichtige Datenbank Web of Knowledge eingebettet werden und Nutzern weltweit zur Verfügung stehen. Der geplante Index gibt nicht nur Auskunft über die Zitationshäufigkeit, sondern stellt auch eine Verbindung zwischen Publikationen und den dazugehörigen Originaldaten bei der Suche nach Artikeln her.

Erstellt wird der Index von Thomson Reuters in Zusammenarbeit mit über 80 internationalen Repositorien, in denen die Daten hinterlegt sind. Um den Index zu erheben, wertet der Konzern Metadaten der Repositorien bibliometrisch aus. Auch die Verlinkung von Suchtreffern mit Datensätzen erfolgt auf diese Weise. Der Konzern verspricht seinen Kunden künftig ein nahtloses Sucherlebnis und sagt voraus, dass der Data Citation Index die Art und Weise wie Datensätze entdeckt und verwendet werden revolutionieren wird. Neben Naturwissenschaftlern sollen auch Sozial- und Geisteswissenschaftler von Thomson Reuters neukreiertem Index profitieren.

Ob der „DCI“ tatsächlich revolutionäre Auswirkungen haben wird, bleibt abzuwarten. „Der Index kann jedoch einen Anreiz dafür schaffen, dass Wissenschaftler die von ihnen produzierten Daten für andere freigeben“, meint Michael Diepenbroek. Der Geowissenschaftler mit Informatikhintergrund ist Koordinator von Pangaea, einem Langzeitarchiv für Erd- und Umweltdaten, welches an das Zentrum für marine Umweltwissenschaften (MARUM) der Universität Bremen und das Alfred Wegener Institut (AWI) in Bremerhaven angeschlossen ist. Diepenbroek wirkte selbst maßgeblich an der Entwicklung des Data Citation Index durch Thomson Reuters mit. Der von ihm geführte kostenfreie Dienst Pangaea stellt zudem Daten für Indexerstellung und Verlinkung mit dem DCI bereit.

„Komplexe Datensätze von Publikationen zugänglich zu machen ist eine längst überfällige notwendige Kurskorrektur der heute gängigen Veröffentlichungspraxis“, sagt Diepenbroek. Die produzierten Daten sind in den vergangenen Jahren beständig größer und umfassender geworden, aber in vielen Fällen sind sie als Grundlage einer Veröffentlichung nicht verfügbar. „Dadurch fehlt die Möglichkeit zur Einsichtnahme und Qualitätskontrolle“, so der Fachmann für Datenspeicherung, der sich seit 1992 mit diesem Thema befasst. Bis es soweit ist, dass Forscher für Ihre Zwecke auf einwandfreie fremde Daten zugreifen können, haben Diepenbroek und seine Kollegen jedoch noch viel zu tun: Es müssen Kriterien für die Vereinheitlichung der Datenformate und die Langzeitarchivierung erstellt werden, auch die Qualität der Repositorien muss gesichert werden. Der neue Data Citation Index könnte sich auf dem Weg zu einer umfassenden Qualitätskontrolle von Daten also als hilfreich erweisen.

 


Melanie Estrella
Bild: codswollop / photocase.com



Letzte Änderungen: 20.07.2012
© 2009 Laborjournal und F & R Internet Agentur