Wikidata:Database downloadख

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Database download and the translation is 100% complete.

Wikidata biedt voor iedereen kopieën van de beschikbare inhoud om te downloaden.अ

Er zijn ook verschillende andere methoden voor toegang tot gestructureerde inhoud van Wikidata, waarbij mogelijk geen volledige databasedump nodig is.

Databasedumps

Er zijn verschillende soorten datadumps beschikbaar. Merk op dat terwijl JSON- en RDF-dumps worden beschouwd als stabiele interfaces, XML-dumps dat niet zijn. Wijzigingen in de gegevensformaten die door stabiele interfaces worden gebruikt, zijn onderhevig aan het Stabiel interfacebeleid.

<span id="JSON_dumps_(recommended)_">

JSON-dumps (aanbevolen)

JSON-dumps met alle Wikidata-entiteiten in een enkele JSON-array zijn te vinden onder https://dumps.wikimedia.org/wikidatawiki/entities/. De entiteiten in de array bevinden zich niet noodzakelijkerwijs in een bepaalde volgorde, bijvoorbeeld Q2 volgt niet noodzakelijkerwijs op Q1. De dumps worden wekelijks aangemaakt.

Dit is het aanbevolen dumpformaat. Raadpleeg de JSON-structuurdocumentatie voor informatie over hoe Wikidata-entiteiten worden weergegeven.

Tip: Elk entiteitsobject (gegevensitem of eigenschap) wordt op een afzonderlijke regel in het JSON-bestand geplaatst, zodat het bestand regel voor regel kan worden gelezen en elke regel afzonderlijk kan worden gedecodeerd als een afzonderlijk JSON-object.

Merk op dat de bestanden parallelle compressie gebruiken, wat betekent dat sommige decompressors de bestanden niet betrouwbaar kunnen uitpakken. Als u Windows gebruikt, kunt u bijvoorbeeld Bzip2 gebruiken. Gebruik op *nix-systemen lbzip2 dat Bzip2 parallel kan decomprimeren. pbzip2 is geen goede keuze omdat het niet in staat is om te decomprimeren in parallelle bestanden die niet zijn gecomprimeerd met pbzip2.

U kunt nu een vrij recente dump downloaden met behulp van een torrent. wikidata-20220103-all.json.gz (109.04 GiB) op academictorrents.com ( magneet)

  • JsonDumpReader is een PHP-bibliotheek voor het lezen van de dumps.
  • gitlab.com/tozd/go/mediawiki is een Go-bibliotheek voor het verwerken van Wikipedia- en Wikidata-dumps.
  • WDSub is een Scala-bibliotheek die JSON Wikibase-dumps verwerkt en subsets kan genereren met behulp van entiteitsschema's als invoer
  • simple-wikidata-db is een JSON dump parser geschreven in Python
  • qwikidata ondersteunt JSON dumps en is geschreven in Python

RDF-dumps

Ten eerste, canonieke RDF dumpt met behulp van de Turtle en NTriples formaten zijn te vinden onder https://dumps.wikimedia.org/wikidatawiki/entities/. De mapping wordt hier beschreven. Deze volledige verklaringen worden genoteerd als all.

Ten tweede worden zogenaamde truthy dumps voorzien. Ze gebruiken het formaat nt. Ze hebben hetzelfde formaat als de volledige dumps, maar zijn beperkt tot directe, waarheidsgetrouwe verklaringen. Daarom bevatten ze geen metagegevens zoals kwalificaties en referenties.

De -all dumpbestanden bevatten alle entiteitsinformatie in Wikidata met uitzondering van de volgorde (van aliassen, van instructies, enz.), die niet van nature wordt weergegeven in RDF. De -truthy dumpbestanden coderen de *beste* verklaringen (d.w.z. die met de hoogste rang van elk gegeven (onderwerp, eigenschap) paren) als enkele RDF-triples (qualifiers en verwijzingen worden weggelaten).

De dumps van Wikidata naamruimte Lexeme in Turtle en NTriples formaten zijn op dezelfde plaats te vinden met het achtervoegsel lexemes.

Voor meer informatie over het RDF-dumpformaat, zie de pagina RDF-dumpindeling.

Gedeeltelijke RDF dumps

WDumper is een hulpmiddel van derden om aangepaste Wikidata RDF-dumps te maken. Entiteiten en verklaringen kunnen worden gefilterd.

XML-dumps

Volledige XML-dumps van Wikidata zijn te vinden op https://dumps.wikimedia.org/wikidatawiki/.

Waarschuwing: De indeling van de JSON-gegevens die zijn ingesloten in de XML-dumps kan zonder voorafgaande kennisgeving worden gewijzigd en kan inconsistent zijn tussen revisies. Het moet worden behandeld als ondoorzichtige binaire gegevens. Het wordt sterk aanbevolen om in plaats daarvan de JSON- of RDF-dumps te gebruiken, die canonieke weergaven van de gegevens gebruiken!

Incrementele dumps (ook wel bekend als Add/Change dumps) van Wikidata zijn ook beschikbaar als download. Deze dumps bevatten alleen de inhoud die veranderd of zijn toegevoegd in de laatste 24 uur. Hierdoor hoeft u geen volledige dump te downloaden, wat tijd kan besparen aangezien deze dumps stukken kleiner zijn dan de normale dumps.

Deze dumps zijn te vinden op https://dumps.wikimedia.org/other/incr/wikidatawiki/.

Oude JSON en RDF dumps

Oude RDF- en JSON-dumps zijn te vinden op de Internet Archive (Q461):

Datamodel

Het datamodel staat hier. Het datamodel beschrijft de fundamentele bouwstenen van Wikidata's data.

Databaseschema

Er is ook een overzicht van het schema van de database. Dit is niet het schema van de gegevens in Wikidata.

Licentie

Deze databases kunnen worden gebruikt voor persoonlijk of commercieel gebruik, back-ups of offline gebruik. Alle gestructureerde gegevens uit de namespace main, Property, Lexeme en EntitySchema zijn beschikbaar onder de Creative Commons CC0-licentie. Tekst in de andere namespaces is beschikbaar onder de Creative Commons Attribution/Share-Alike License; Er kunnen aanvullende voorwaarden van toepassing zijn. Media-items en andere inhoud zijn beschikbaar onder andere licenties, zoals beschreven op hun beschrijvingspagina's.

Zie ook