Shortcut: WD:JSON

Wikidata:Unduhan basis data

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Database download and the translation is 93% complete.

Other languages:
العربية • ‎беларуская • ‎বাংলা • ‎català • ‎čeština • ‎dansk • ‎Deutsch • ‎dolnoserbski • ‎Ελληνικά • ‎English • ‎Esperanto • ‎español • ‎فارسی • ‎suomi • ‎français • ‎Frysk • ‎ગુજરાતી • ‎עברית • ‎hornjoserbsce • ‎հայերեն • ‎Bahasa Indonesia • ‎italiano • ‎日本語 • ‎ქართული • ‎한국어 • ‎Ripoarisch • ‎Lëtzebuergesch • ‎latviešu • ‎македонски • ‎Bahasa Melayu • ‎norsk bokmål • ‎Nederlands • ‎occitan • ‎polski • ‎پښتو • ‎português do Brasil • ‎русский • ‎српски / srpski • ‎svenska • ‎ไทย • ‎Türkçe • ‎українська • ‎中文

Crystal Project Db update.png

Wikidata menyediakan salinan data untuk diunduh siapapun.

Perhatikan bahwa ada beberapa metode lainnya untuk mengakses konten terstruktur dari Wikidata, yang mungkin tidak memerlukan timbunan basis data yang lengkap.

Timbunan basis data

Ada beberapa jenis timbunan data berbeda yang tersedia. Ingatlah bahwa timbunan JSON dan RDF dianggap sebagai "antarmuka yang stabil", sedangkan XML tidak. Perubahan format daya yang digunakan oleh antarmuka stabil bergantung pada Kebijakan Antarmuka Stabil.

Timbunan JSON (disarankan)

Timbunan JSON mengandung semua entitas Wikidata dalam jajaran JSON tunggal yang dapat ditemukan di https://dumps.wikimedia.org/wikidatawiki/entities/. Entitas tersebut dalam jajaran tidak selamanya dalam susunan tertentu, seperti Q2 tidak selalu setelah Q1. Timbunan itu dibuat setiap minggu.

Ini adalah format timbunan yang disarankan. Silakan merujuk pada dokumentasi struktur JSON untuk informasi mengenai bagaimana entitas Wikidata ditampilkan.

Kiat: Setiap objek entitas (butir data atau atribut) terletak pada baris terpisah dalam berkas JSON, sehingga data dapat dibaca per baris, dan tiap baris dapat didekode secara terpisah sebagai sebuah kesatuan objek JSON.

Ingatlah bahwa berkas tersebut menggunakan kompresi paralel, yang artinya beberapa dekompresor tidak dapat diandalkan untuk membuka berkas itu. Apabila Anda menggunakan Windows, gunakan seperti Bzip2.

JsonDumpReader adalah pustaka PHP untuk membaca isi timbunan.

Timbunan RDF

Pertama, timbunan RDF kanonikal menggunakan format Turtle yang dapat ditemukan di https://dumps.wikimedia.org/wikidatawiki/entities/. Pemetaan tersebut dijelaskan di sini. Pernyataan lengkap dicatat sebagai all.

Kedua, apa yang disebut timbunan truthy disediakan. Semuanya menggunakan format nt. Semua itu memiliki format yang sama seperti timbunan seluruhnya, tetapi terbatas pada pernyataan langsung dan truthy. Oleh sebab itu, mereka tidak berisi metadata seperti kualifikasi dan referensi.

Timbunan lengkap berisi semua informasi entitas di Wikidata dengan pengecualian susunan (nama lain, pernyataan, dll.), yang tidak umum mewakili dalam RDF. Timbunan sederhana mengenkode pernyataan yang tidak memiliki kualifikasi sebagai rangkap tiga RDF tunggal (referensi diabaikan).

Timbunan XML

Unduhan dalam format XML dapat diperoleh di sini.

Penting: Format untuk data JSON di keluaran XML dapat diubah sewaktu-waktu tanpa pemberitahuan sebelumnya, dan dapat tidak konsisten antar revisi. Ini harus diperlakukan sebagai data biner yang buram. Sagat direkomendasikan untuk menggunakan keluaran JSON atau RDF, yang menggunakan representasi tunggal data!

Berisi penambahan dalam 24 jam terakhir, sehingga tidak perlu mengunduh secara keseluruhan.

Unduhan ini tersedia di https://dumps.wikimedia.org/other/incr/wikidatawiki/.

Lexicographical data

Lexical data dumps are not yet available for download. See corresponding Phabricator ticket.

Timbunan lama JSON dan RDF

Timbunan lama RDF dan JSON dapat ditemukan di Internet Archive (Q461):

Model data

Model data dapat dicari di sini. Model data menjelaskan blok bangunan fundamental dari data Wikidata.

Skema basis data

Gambaran luas skema basis data dapat ditemukan di halaman ini. (Ini bukanlah skema data di Wikidata.)

Lisensi

Databese-database ini dapat digunakan baik untuk keperluan pribadi maupun komersial, backup data, maupun penggunaan secara luring. Semua data terstruktur dari ruang nama utama dan properti tersedia di bawah lisensi Creative Commons CC0. Teks dalam ruang nama lain tersedia di bawah Lisensi Creative Commons Atribusi/Pembagian Serupa; ketentuan tambahan mungkin berlaku. Item media dan konten lainnya tersedia di bawah lisensi lain, seperti yang dijelaskan pada halaman deskripsinya.