Shortcut: WD:RDF

Wikidata:Datenbank-Download

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Database download and the translation is 93% complete.

Other languages:
العربية • ‎беларуская • ‎বাংলা • ‎català • ‎čeština • ‎dansk • ‎Deutsch • ‎dolnoserbski • ‎Ελληνικά • ‎English • ‎Esperanto • ‎español • ‎فارسی • ‎suomi • ‎français • ‎Frysk • ‎ગુજરાતી • ‎עברית • ‎hornjoserbsce • ‎Հայերեն • ‎Bahasa Indonesia • ‎italiano • ‎日本語 • ‎ქართული • ‎한국어 • ‎Ripoarisch • ‎Lëtzebuergesch • ‎latviešu • ‎македонски • ‎Bahasa Melayu • ‎norsk bokmål • ‎Nederlands • ‎occitan • ‎polski • ‎پښتو • ‎português do Brasil • ‎русский • ‎српски / srpski • ‎svenska • ‎ไทย • ‎Türkçe • ‎українська • ‎中文
Crystal Project Db update.png

Wikidata bietet Kopien des verfügbaren Inhalts zum Herunterladen für jeden.

Es gibt weitere andere Methoden um auf die Datenbank zuzugreifen, die keinen kompletten Dump der Datenbank benötigen.

Datenbank Dumps

There are several different kinds of data dumps available. Note that while JSON and RDF dumps are considered stable interfaces, XML dumps are not. Changes to the data formats used by stable interfaces are subject to the Stable Interface Policy.

JSON Dumps (empfohlen)

JSON Dumps die alle Wikidata Datensätze als eine Liste enthalten, finden sich auf https://dumps.wikimedia.org/wikidatawiki/entities/. Sie werden wöchentlich erstellt. Die Entitäten im Array sind nicht zwangsläufig in einer bestimmten Reihenfolge, z.B. folgt Q2 nicht unbedingt Q1. Diese Dumps werden wöchentlich erstellt.

Dieses ist das empfohlene Format für Dumps. Bitte siehe die JSON-Struktur-Dokumentation für Informationen darüber, wie dort Wikidata-Entitäten dargestellt werden.

Hiweis: Jeder Datensatz (Objekt oder Eigenschaft) bekommt eine eigene Zeile in der JSON Datei, so dass die Datei Zeile für Zeile gelesen und jede Zeile separat als eigenständiges JSON-Objekt dekodiert werden kann.

Note that the files are using parallel compression, which means that some decompressors cannot reliably unpack the files. If you are using Windows you can use e.g. Bzip2.

JsonDumpReader ist eine PHP-Bibliothek zum Lesen der Dumps.

RDF Dumps

Erstens finden sich kanonische RDF-Dumps im Turtle-Format finden unter https://dumps.wikimedia.org/wikidatawiki/entities/. Das Mapping wird hier beschrieben. Diese vollständigen Datensätze werden mit all markiert.

Zweitens werde sogenannte truthy Dumps zur Verfügung gestellt. Sie benutzen das nt-Format. Sie sind im selben Format wie die vollständigen Dumps, aber beschränkt auf direkte, "truthy" Aussagen. Sie enthalten keine Metadaten wie Qualifier und Referenzen.

Das Wikidata Toolkit Projekt stellt auch RDF-Dumps bereit, die eine etwas andere Abbildungsmethode verwenden. Diese Dumps finden sich auf http://tools.wmflabs.org/wikidata-exports/rdf/. Die RDF Abbildungsmethode, die vom Wikidata Toolkit verwendet wird, ist beschrieben auf Introducing Wikidata to the Linked Data Web.

Die kompletten Dumps zusammen enthalten alle Information in Wikidata mit Ausnahme der Reihenfolge (der Alternativnamen, der Eigenschaften etc.), was in RDF normalerweise nicht dargestellt wird. Vereinfachte Dumps haben Aussagen, die keine Qualifikatoren als einzelne RDF-Tripel enthalten, Quellennachweise sind also weggelassen.

XML dumps

Komplette XML dumps von Wikidata finden sich unter http://dumps.wikimedia.org/wikidatawiki.

Warnung: Das Format der JSON Daten, die eingebettet sind in die XML Dumps kann sich jederzeit ändern ohne dass dieses bekannt gemacht wird, und kann inkonsistent zwischen den Versionen sein. Es sollte als opake binäre Daten behandelt werden. Es wird stark empfohlen die JSON- oder RDF- Dumps zu verwenden, die eine festgelegte Darstellung der Daten bieten.

Es gibt ebenfalls inkrementelle Sicherungen von Wikidata zum Herunterladen. Diese Sicherungen enthalten alle Änderungen der letzten 24 Stunden. Dadurch ist es nicht notwendig, die komplette Sicherung herunter zu laden, zudem benötigen diese erheblich weniger Speicherplatz.

Sie können gefunden werden auf https://dumps.wikimedia.org/other/incr/wikidatawiki/.

Alte JSON- und RDF-Dumps

Alte RDF- und JSON-Dumps sind im Internet Archive (Q461) zu finden:

Datenmodell

Das Datenmodell kann hier eingesehen werden. Das Datenmodell beschreibt die grundlegenden Bausteine der Daten auf Wikidata.

Datenbankschema

Einen Überblick über das Schema der Datenbank findet sich auf dieser Seite. (Dieses ist nicht das Schema der Daten auf Wikidata.)

Lizenz

Wikidata stellt Kopien der verfügbaren Inhalte zum Herunterladen bereit. Diese Datenbanken können für privaten oder kommerziellen Nutzen sowie für backups oder offline genutzt werden. Alle strukturierten Daten des Haupt- und Eigenschaftennamensraums sind unter der Creative Commons CC0 Lizenz verfügbar. Text in den anderen Namensräumen ist unter der Creative Commons Attribution/Share-Alike Lizenz Creative Commons Attribution/Share-Alike Lizenz verfügbar; weitere Lizenzen können beantragt werden. Medien und andere Inhalte sind unter verschiedenen Lizenzen verfügbar, wie es auf ihrer Beschreibungsseite angegeben ist.