Shortcut: WD:JSON

Wikidata:Tietokannan lataaminen

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Database download and the translation is 30% complete.

Outdated translations are marked like this.
Other languages:
Bahasa Indonesia • ‎Bahasa Melayu • ‎Deutsch • ‎English • ‎Esperanto • ‎Frysk • ‎Lëtzebuergesch • ‎Nederlands • ‎Ripoarisch • ‎Türkçe • ‎català • ‎dansk • ‎dolnoserbski • ‎español • ‎français • ‎hornjoserbsce • ‎italiano • ‎latviešu • ‎norsk bokmål • ‎occitan • ‎polski • ‎português do Brasil • ‎suomi • ‎svenska • ‎čeština • ‎Ελληνικά • ‎беларуская • ‎македонски • ‎русский • ‎српски / srpski • ‎українська • ‎հայերեն • ‎עברית • ‎العربية • ‎فارسی • ‎پښتو • ‎বাংলা • ‎ગુજરાતી • ‎ไทย • ‎ქართული • ‎中文 • ‎日本語 • ‎한국어

Crystal Project Db update.png

Wikidata tarjoaa kopioita sisällöstä kaikille ladattavaksi.

Huomaa, että on olemassa myös muita tapoja päästä käsiksi Wikidatan tietoon, jotka eivät välttämättä vaadi kokonaisia tietokantavedoksia.

Database dumps

There are several different kinds of data dumps available. Note that while JSON and RDF dumps are considered stable interfaces, XML dumps are not. Changes to the data formats used by stable interfaces are subject to the Stable Interface Policy.

JSON dumps (recommended)

JSON-tietokantavedokset, jotka sisältävät kaikki Wikidata-entiteetit listana, löytyvät osoitteesta http://dumps.wikimedia.org/other/wikidata/. Näitä vedoksia luodaan viikoittain.

This is the recommended dump format. Please refer to the JSON structure documentation for information about how Wikidata entities are represented.

Hint: Each entity object (data item or property) is placed on a separate line in the JSON file, so the file can be read line by line, and each line can be decoded separately as an individual JSON object.

Note that the files are using parallel compression, which means that some decompressors cannot reliably unpack the files. If you are using Windows you can use e.g. Bzip2.

JsonDumpReader is a PHP library for reading the dumps.

RDF dumps

First, canonical RDF dumps using the Turtle format can be found under https://dumps.wikimedia.org/wikidatawiki/entities/. The mapping is described here. These full statements are noted as all.

Secondly, so called truthy dumps are provided. They use the nt format. They are in the same format as the full dumps, but limited to direct, truthy statements. Therefore, they do not contain meta data such as qualifier and references.

The complete dumps together contain all entity information in Wikidata with the exception of order (of aliases, of statements, etc.), which is not naturally represented in RDF. Simplified dumps encode statements that have no qualifiers as single RDF triples (references are omitted).

XML dumps

XML-tietokantavedokset ovat saatavilla osoitteesta http://dumps.wikimedia.org/wikidatawiki/.

Warning: The format of the JSON data embedded in the XML dumps is subject to change without notice, and may be inconsistent between revisions. It should be treated as opaque binary data. It is strongly recommended to use the JSON or RDF dumps instead, which use canonical representations of the data!

Lisäysvedoksia (tai lisäys–muutosvedoksia) Wikidatasta on myös saatavilla ladattavaksi. Nämä vedokset sisältävät viimeisten 24 tunnin aikana lisätyn aineiston, mikä vähentää tarvetta ladata koko tietokannan vedos. Nämä vedokset ovat myös huomattavasti pienempikokoisia kuin koko tietokannan vedokset.

Nämä vedokset ovat saatavissa täällä.

Lexicographical data

Lexical data dumps are not yet available for download. See corresponding Phabricator ticket.

Old JSON and RDF dumps

Old RDF and JSON dumps can be found on the Internet Archive (Q461):

Datamalli

The data model can be looked up here. The data model describes the fundamental building blocks of Wikidata's data.

Database schema

An overview over the schema of the database can be found at this page. (This is not the schema of the data in Wikidata.)

Lisenssi

Wikidata tarjoaa kopioita saatavilla olevasta sisällöstä ladattavaksi. Näitä tietokantoja voi käyttää henkilökohtaisessa tai kaupallisessa käytössä, varmuuskopioina tai käytössä ilman Internet-yhteyttä. Kaikki jäsennetty data pää- ja ominaisuusnimiavaruuksista on saatavilla Creative Commons CC0 -lisenssillä. Teksti muissa nimiavaruuksissa on saatavilla Creative Commons Nimeä-Tarttuva -lisenssillä; voimassa voi olla lisäehtoja. Media ja muu sisältö ovat saatavilla muilla lisensseillä sen mukaan, mitä niiden kuvaussivuilla on ilmoitettu.