Shortcut: WD:GLOSS

Wikidata:Slovníček

From Wikidata
Jump to: navigation, search
This page is a translated version of the page Wikidata:Glossary and the translation is 62% complete.

Outdated translations are marked like this.
Other languages:
العربية • ‎azərbaycanca • ‎беларуская • ‎беларуская (тарашкевіца)‎ • ‎বাংলা • ‎bosanski • ‎català • ‎čeština • ‎dansk • ‎Deutsch • ‎Zazaki • ‎dolnoserbski • ‎Ελληνικά • ‎English • ‎British English • ‎Esperanto • ‎español • ‎euskara • ‎فارسی • ‎suomi • ‎français • ‎Frysk • ‎ગુજરાતી • ‎עברית • ‎हिन्दी • ‎hornjoserbsce • ‎magyar • ‎Հայերեն • ‎interlingua • ‎Bahasa Indonesia • ‎Ilokano • ‎íslenska • ‎italiano • ‎日本語 • ‎ქართული • ‎한국어 • ‎Ripoarisch • ‎Latina • ‎Lëtzebuergesch • ‎lietuvių • ‎latviešu • ‎македонски • ‎മലയാളം • ‎Bahasa Melayu • ‎norsk bokmål • ‎Nederlands • ‎norsk nynorsk • ‎occitan • ‎ਪੰਜਾਬੀ • ‎polski • ‎پښتو • ‎português • ‎português do Brasil • ‎română • ‎русский • ‎Scots • ‎srpskohrvatski / српскохрватски • ‎српски / srpski • ‎српски (ћирилица)‎ • ‎svenska • ‎Kiswahili • ‎ślůnski • ‎தமிழ் • ‎తెలుగు • ‎ไทย • ‎Türkçe • ‎українська • ‎اردو • ‎Tiếng Việt • ‎ייִדיש • ‎中文 • ‎中文(中国大陆)‎ • ‎中文(简体)‎ • ‎中文(繁體)‎

Wikidata jsou databáze vědomostí, kterou může upravovat kdokoli. Seznamte se s tímto slovníčkem Wikidat, aby všichni používali stejnou terminologii, což by mělo vylepšit komunikaci mezi editory a vývojáři.

Slovníček je řazen tematicky, nikoli abecedně, tak aby ty nejzákladnější pojmy byly co nejdříve. Je to proto, že se překládá do mnoha jazyků a v různých jazycích se daný koncept označuje různě. Někdy nemusí být řazení očividné. V takových případech je v příslušné sekci i odkaz „viz též“.

Názvy a projekty

  • Wikimedia je název hnutí, které skrze projekty Wikimedia zdarma poskytuje veřejnosti vědomosti.
  • Projekty Wikimedia jsou svobodné wiki mající specifický účel, které jsou obvykle rozděleny do vícera jednotlivých jazykových verzí, jako je Wikipedie. Wikidata jsou vícejazyčný projekt Wikimedia. V rámci projektů Wikimedia existuje celkem 800 rozdílných wiki. Prozatím je možné propojit s Wikidaty jen projekty Wikimedia.
  • MediaWiki je svobodný software, na kterém běží všechny projekty Wikimedia. Protože je zdarma, existují tisíce instalací MediaWiki spravované samostatnými osobami či organizacemi jinými než nadace Wikimedia; viz Co je MediaWiki.
  • Wikibase je software, na kterém Wikidata běží. Tvoří jej celkem tři rozšíření MediaWiki: Wikibase, Klient Wikibase a WikibaseLib.
    1. Rozšíření Wikibase (v případě serveru Wikidat označováno anglicky jako repository, repo) umožňuje speciální instalaci MediaWiki shromažďovat a udržovat strukturovaná data, která se potom využívají na stránkách Wikidat.
    2. Klientské rozšíření Wikibase (klient, anglicky client) umožňuje instalacím MediaWiki, například Wikipediím, dotazovat se serveru Wikidat a zobrazovat na svých stránkách data z Wikidat; používá se na Wikipediích v různých jazycích a mnoha dalších sesterských projektech.
    3. Rozšíření WikibaseLib obsahuje knihovny společné oběma výše jmenovaným.

Wikidata je projekt Wikimedia, provozovaný na MediaWiki s rozšířeními Wikibase. Umožňuje editorům Wikidat vkládat data a prohlížení stránek.

Základní termíny

  • Data a metadata

Data jsou informace, jako slova, která právě čtete. Wikidata jsou v zásadě sbírka strukturovaných dat neboli databázového obsahu. Tato data obsahují v zásadě vše, co editoři a boti vložili prostřednictvím stránek entit a veřejného programového rozhraní. Wikistránky, ze kterých může uživatel data číst a kam je může vkládat, spadají do tří jmenných prostorů:

  1. hlavního jmenného prostoru (pro položky), který seskupuje stránky, kde se nacházejí data o specifické entitě,
  2. jmenného prostoru vlastností, kde se nacházejí informace o vlastnostech, které se používají ke strukturování dat, vkládaných do tvrzení, a
  3. jmenného prostoru pro dotazy, kde můžeme určovat další způsoby, jak získávat a zobrazovat informace, než poskytuje hlavní prostor.

Data v těchto jmenných prostorech jsou strukturovaná, protože jsou všechna organizovaná způsobem, jakým software Wikibase zajišťuje určitý datový model, a protože komunita definuje správný způsob vkládání informací a vynucuje ho.

Metadata jsou ve Wikidatech strukturované informace, které nevytvářejí uživatelé a boti, ale software MediaWiki. Příkladem metadat je historie verzí stránky. Záznamy s časy a uživatelskými jmény generuje software.

Jiné stránky Wikidat jsou klasické wikistránky, které se skládají se z nestrukturovaných dat nebo polostrukturovaných dat a tvoří meta stránky, jako jsou komunitní diskusní stránky.

Zvláště důležitým druhem dat jsou data vlastností. Data vlastností tvoří hodnoty přiřazené k vlastnosti, čím vznikne tvrzení, organizační jednotka strukturovaných dat. Vlastnost má přiřazen datový typ, který definuje hodnoty dat vlastností, které lze využívat v tvrzeních vytvořených pomocí této vlastnosti.

  • Dataset

Dataset je všeobecně jakákoli kolekce (strukturovaných) dat.

To, co se ve Wikidatech označuje jako dataset, je často spojeno s entitou: dataset spojený s entitou jsou veškeré informace zobrazené na příslušné wikistránce (sada výroků v databázi, ve kterých tato entita vystupuje v roli subjektu, odkazy na články na projektech Wikimedia, které tuto entitu popisují, …).

Jiné datasety můžeme stavět kombinováním datasetů několika entit.

Datasety lze reprezentovat různými způsoby: jako příslušnou wikistránku entity nebo jako soubor ve formátu XML či JSON pro roboty a počítačové programy. Speciálně v [$1 hlášeních uživatelského rozhraní] Wikidat dataset odkazuje na data přiřazená entitě (položce, vlastnosti či dotazu).

Odkazovatelné URI (en:dereferenceable URI) je textový řetězec s definovanou strukturou, který slouží k přesné specifikaci zdroje informací. Obsah odkazovatelných URI bude možné zobrazit na stránce Special:EntityData.

  • Export je způsob, jak je možné obsah dat a meta-stránek získat pro další určení. Cílem je zpřístupnit strojově čitelné exporty dat v populárních formátech jako JSON či RDF/XML.
  • Propojená data je způsob, jak publikovat strukturovaná data, aby byla navzájem propojená a tím užitečnější. Je základním principem Wikidat.
  • Trojička je způsob uložení dat v propojených datech. Sestává z podmětu, přísudku a předmětu. Ve Wikidatech se jedná přibližně o položku, vlastnost a hodnotu.

Ontologie Ontologie je výslovná a formální specifikace konceptualizace. Je důležité, aby vyjadřovala sdílené porozumění nějaké oblasti poznání. Wikidata za tím účelem definují vlastnosti v tvrzeních, která popisují externí entity (objekty reálného světa) ve vztahu k objektům a datům.

Původ Je to posloupnost vlastnictví, nebo jak by tomu bylo v případě crowdsourcingu, posloupnost přispěvatelů, ale také odkud data pocházejí.

  • Slovník Soubor termínů popisujících ontologii. Termíny jednoho slovníku mohou být stejné (owl:sameAs) jako některé termíny jiného slovníku. Jsou stejné je striktnější než odpovídají si.

Odkazy na články

Odkazy na články (en:sitelinks; v uživatelském rozhraní Seznam stránek svázaných s touto položkou) je seznam odkazovaných stránek neboli článků na Wikipediích v různých jazycích. Skládají se ze zkratky webu a jména článku. Přiřazují se k jednotlivým položkám na Wikidatech. (Tyto odkazy na Wikidatech nahradily starší systém mezijazykových odkazů [interwiki], viz cs:Nápověda:Mezijazykové odkazy.) V budoucnost budou mít přiložené odznaky indikující např. status nejlepšího článku. Viz Help:Sitelinks.

Zkratka webu (en:site) v rámci odkazů na články je odkaz na jednu z Wikipedií (patřících Wikimedia foundation) pomocí globálního identifikátoru (angl. siteid). Například siteid anglické Wikipedie je enwiki. Většinou je tvoří počáteční písmena projektu plus několik písmen ze subdomény. Odkazování na takové websity však může mít jistá omezení. V současném nastavení má každá externí stránka pouze jeden odkaz na Wikidata a každá položka může mít pouze jeden odkaz na každou externí stránku.

  • Odznak (en:badge) je značka umístěná u odkazu na článek, která označuje například nejlepší článek u dané stránky. Nejde o popis či vlastnost dané entity, ale o vlastnost příslušné stránky.

Jmenné prostory

  • Stránka Interní nebo externí webová stránka s unikátním jménem, např. článek v hlavním jmenném prostoru Wikipedie nebo položka v hlavním jmenném prostoru Wikidat. Ve Wikidatech může pojem "stránka" označovat položku nebo vlastnost v datových jmenných prostorech, meta stránku v jiných jmenných prostorech nebo externí propojenou stránku na Wikipedii nebo jiném webu Wikimedia, která je propojena pomocí odkazu na článek. Na stránkách v hlavním jmenném prostoru Wikidat se nacházejí položky a každá stránka může obsahovat pouze jednu vlastní položku.
  • Meta stránky jsou všechny stránky, které nejsou entitami, tedy nepatří do jmenného prostoru data. Meta stránky na Wikidatech obsahují nestrukturovaný obsah v klasickém formátu MediaWiki.<, and perhaps also future Wikidata client side inclusion code.--> Patří sem například diskuzní stránky, kategorie, projektové stránky (ve jmenném prostoru Wikidata) a nápověda (jmenný prostor Help). Meta stránky také zahrnutjí obsah a data automaticky generované MediaWiki, např. historii stránky nebo speciální stránky.
  • Jmenný prostor - MediaWiki namespace (Q18889113) View with Reasonator See with SQID slouží pro odlišení stránek v MediaWiki podle jejich účelu či specifického chování. Mezi jmenné prostory patří např. kategorie, soubory, uživatelé a v případě Wikidat i jmenné prostory pro položky, vlastnosti, či dotazy. Viz seznam jmenných prostorů.
  • Hlavní jmenný prostor Jmenný prostor, ve kterém se nacházejí všechny položky. Lze jej poznat díky tomu, že na rozdíl od ostatních nemá prefix.

Entity, položky, vlastnosti a dotazy

Entita (též data set) je datový obsah stránky Wikidat (tedy položky, vlastnosti nebo dotazu). Každou entitu identifikuje entity ID – číslo s prefixem Q (položka), P (vlastnost) nebo U (dotaz). Také ji identifikuje kombinace štítku a popisu v daném jazyce. (V ontologiích a katalozích knihoven, kterými byl návrh Wikidat inspirován, se entita používá pro označené reálné věci nebo osoby, tomu my ale říkáme položka.)

Položka (en:item) je stránka v hlavním jmenném prostoru na Wikidatech, jejímž předmětem je nějaké téma, které existuje ve skutečnosti. Položka je identifikována odkazem na článek (propojeným článkem na některé Wikipedii), nebo kombinací štítku a popisu. Aliasy usnadňují vyhledávání. Položka může být chápána jako „podnět“ trojičky v propojených datech.

Vlastnost (en:property) je menší část položky. Vlastnost slouží jako popisovač hodnoty nebo sady hodnot uvnitř položky, ale není hodnotou samotnou. Každá vlastnost je popsána na vlastní stránce a má svůj vlastní identifikátor. Vlastnost může být chápána jako přísudek v tripletu propojených dat.

Dotaz (plánováno) bude předdefinovaným vyhledáváním v položkách. Dotaz bude moci sloužit jako deskriptor předdefinovaného vyhledávání, ale ne pro výsledky vyhledávání. Každý dotaz je entita, je popsán a definován na své stránce a má svůj vlastní prefixový identifikátor Query:U. Provoz dotazů není ještě připraven, viz zprávu $2 zobrazovanou při pokusu [$1 založit nový dotaz].

Identifikátory a jazyky

Mnoho projektů Nadace Wikimedia existuje v různých jazykových verzích, Wikidata však nikoliv. Wikidata jsou mnohojazyková, tedy všechny části uživatelského rozhraní i samotný obsah jsou přeložitelné a mohou být používány v mnoha jazycích. Uživatel si může zvolit svůj preferovaný jazyk. Wikidata by měla stavět všechny jazyky na roveň a projovat znalosti v mnoha jazycích tak, aby data vkládaná v jednom jazyce mohla být použita i v ostatních jazycích. Uživatelé mohou překládat všechny stránky do různých místních jazyků a postupně tak zlepšovat použitelnost Wikidat.

Jméno (en:title) externí stránky je odkaz na článek na příslušném projektu. U interních stránek mají svůj název meta stránky, nebo jde o Entity ID stránky entity; pokud nejsou v hlavním jmenném prostoru, začínají označením jmenného prostoru.

    1. Jméno položky, vlastnosti a dotazy je identifikátor, který se skládá z prefixu a číselného id. Například jméno vlastnosti je Property:P17, jméno položky Q6256. URL stránky je www.wikidata.org/wiki + jméno. Při vyhledávání se zobrazuje štítek v jazyce rozhraní, za ním identifikátor v závorkách bez prefixu a popis, aby byl řetězec jako celek snáze čitelný.

Pro odkazy na články je názvem normalizovaný řetězec, který identifikuje stránku na externí wiki. Společně se siteid a názvem vytvářejí kompletní odkaz na článek. V průběhu ověřování názvu projde řetězec procedurou normalizace a nakonec bude názvem normalizované označení stránky. Nový stránkový odkaz může být uložený až tehdy, kdy je dokončena normalizace a splněny podmínky pro konkrétní website.

Pro meta stránky v jmenných prostorech neurčených pro entity je název vypsán tak, jak je, a identifikuje interní stránku. Jmenný prostor je obvykle přednastaven pro řetězec i pro URL.

Jazykové atributy Tyto atributy jsou štítky, aliasy a popisy v konkrétním jazyce přiřazené k položkám, vlastnostem a dotazům. Text v nich je určen pro člověka a má zprostředkovat pochopení, o jakou věc ve skutečném světě jde. Pokud tyto atributy chybí, některý z nich mohou být nahrazeny z jiných jazyků pomocí řetězce záložních jazyků.

Záložní jazyky (řetězce záložních jazyků) Způsob jak systematicky nahrazovat chybějící jazykové atributy textem v náhradním jazyce. Konkrétní pravidla náhrad mohou být volena podle typu stránky, podle toho, zda je uživatel přihlášen, nebo v případě jeho přihlášení podle toho, zda si vybral své upřednostňované jazyky.

Štítek (en:label) je jméno položky, vlastnosti a dotazu v konkrétním jazyce. Je to obvykle nejdůležitější jméno, pod jakým je heslo známé, nebo obecně nebo nejsnáze pochopitelná fráze, pod kterou je heslo známé interně na projektu. Uvnitř Wikidat přejímá úlohu názvu článku na Wikipedii a používá se k základnímu rozlišování hesel. Není nutné, aby šlo o unikátní označení, pokud jde o položky, a to ať už z pohledu jazyka nebo celkově projektu; musí ale být unikátní společně s popisem. Pro vlastnosti a dotazy (dosud nedefinováno) musí být unikátní uvnitř daného jazyka. Unikátnost kombinace štítku a popisu je klíčovou podmínkou, která musí být splněna, než dojde k uložení jakékoli změny, i když v budoucnosti může být odstraněna.
Štítky by měly používat zásady užívání velkých písmen pro vlastní jména a fráze tak, jak odpovídají konkrétnímu heslu i danému jazyku. Ve výpisech je každý štítek doprovázen popisem tak, že společně vytvářejí jednu položku výpisu. Jak štítek, tak popis ale mohou být vyňaty a používány odděleně. Viz Help:Štítek.

See Help:Label.

Popis (en:description) stručně popisuje položku, vlastnost či dotaz v konkrétním jazyce. Upřesňuje se jím štítek a zvlášť se hodí pro rozlišení položek se stejným štítkem. Unikátní kombinace štítku a popisu je předpokladem uložení jakékoli změny. (Popis má být krátký větný úsek a ne věta, takže bez interpunkce a velkých písmen.)

Viz Help:Description pro více informací, včetně osvědčených stylů popisů.
  • Aliasy
V uživatelském rozhraní se označují jako Also known as. Jsou to alternativní štítky pro příslušné jazyky a může jich být libovolný počet, kolik je třeba.
Viz Nápověda:Aliasy.

Tvrzení a výroky

Části výroku

In order to use Wikidata, the knowledge contained in different sources must be decomposed. A source might read Wolfgang Amadeus Mozart was a composer who was born 27 January 1756 and died in 5 December 1791. We need to decompose the information contained in this sentence and transform it into claims and statements: name: Wolfgang Amadeus Mozart; date of birth: 27 January 1756; date of death: 5 December 1791; occupation: composer. Both claims and (Wikidata) statements are expressed into a so called statement to be used as linked data by external websites or organization, but they are slightly refined to fit their purpose in Wikidata. Usually the statement itself in linked data is described by a single triplet, but when the statement in itself is reified, it is possible to say something more about the statement. We may say it has a value, that is our original triple (or tuple to be more general), and we may say something about that value like when and how the value is recorded or measured. Such statements about a statement is in Wikidata called qualifiers to separate them more clearly from our statements. Without doing this it could be difficult to separate the different types of statements from each other.

Statements describing references for the particular reified statement can also be made. Those are also statements about statements, but they have different roles and are also given special names. This is done by adding references. References are also reified statements so we can make statements about them, that is we can give them qualifiers. Note that references are reified statements about reified statements. It is a good thing that we can talk about references with qualifiers, that makes it somewhat clearer. (Another way to say things about references is to give them their own items and to add statements about it.)

To implement the basic assertion, the core triplet or rather the duplet as the subject is given as the item itself, a small structure called a snak is used. Those come in several versions, each specialized for a single purpose. Statements hold such snaks, and they are also the inner parts of statements about statements that is qualifiers, references and ranks. Part of the specialization for snaks is that some of them can hold a value of a special type, a datatype. A snak will refuse to hold any other type than what it is configured to store.

During the lifetime of a statement it might be set to normal, until it is deemed preferred, and later on it might be replaced by a more up to date value and marked deprecated. Those values are nothing more than statements about the reified statement, but it is given its own name and appearance in the user interface.

  • Tvrzení (en:claim) je jedna informace o entitě, na jejíž stránce se tvrzení vyskytuje. Tvrzení sestává z vlastnosti (např. „stát“) a hodnoty (např. „Německo“), nebo jiného vztahu nebo složené nebo chybějící hodnoty. Tvrzení dále může mít vymezení, které například blíže určují jeho časovou platnost. Terminologií trojiček v propojených datech: Podnět je u tvrzení vlastnost, přísudek je hodnota. Tvrzení jsou na stránce položky v sekci výroky, kde mnohou být doplněny referencemi a hodnocením; také se mohou vyskytnout na jiných stránkách.
  • Výrok (en:statement) je název pro jednu konkrétní informaci o položce, na jejíž stránce se nachází. V nejjednodušším případě je výrok jen párem „vlastnost: hodnota“ (např. „Země: Německo“), ale často výroky obsahují další vymezení (např. časová). Wikidata neposuzují správnost a přesnost výroků, pouze je shromažďují a uvádějí je s referencí (odkazem na zdroj).

Hodnoty (en:values) jsou konkrétní údaje vložené v každém tvrzení. Podle datového typu může jít o hodnotu jednoduchou (např. číslo) nebo o hodnotu skládající se z více částí (např. zeměpisnou polohu udává zeměpisná šířka a zeměpisná délka). Vnitřně jsou propojené s tvrzeními prostřednictvím konektorů.

Modify the snaktype (value/some value/no value) here.

Bez hodnoty (en:novalue) – pro danou vlastnost není známa žádná hodnota. Neznamená to odmítnutí výroku.

Neznámá hodnota (en:somevalue) – nějaká hodnota existuje, ale že se o hodnotě nic neví, jenom to, že existuje. Neznamená to odmítnutí výroku.

Uživatelská hodnota (en:customvalue) – hodnota vlastnosti je známá. Neměly by se přidávat hodnoty, o kterých je známo, že jsou nesprávné, ledaže se u nich uvede zavržené postavení.

Konektor (en:snak) je vnitřní abstraktní vrstva mezi hodnotami (včetně neznámých hodnot a žádných hodnot) a položkami na jedné straně a výroky a tvrzeními na straně druhé. Obvykle tato vrstva nebude viditelné v uživatelském rozhraní, ale bude viditelná při importu dat v REST API.

Datový typ (en: datatype) určuje, jakých hodnot může nabývat vlastnost a jak budou tyto hodnoty v každém tvrzení uloženy. Každé vlastnosti je přiřazen předdefinovaný typ dat. Viz Seznam dostupných datových typů.

  • Řetězec (en: string; zkratka pro řetězec znaků) je volně zvolená sekvence znaků interpretovaná jako text (např. „Ahoj“) — na rozdíl od numerické hodnoty (3,14), odkazu na položku (např. [[Q1234]]) nebo komplexnějších datových typů (např. množina {1,3,5,7} ). Wikidata budou kromě datového typu řetězec jako hodnoty podporovat také texty závislé na jazyce, a to „jednojazyčný text“ a „mnohojazyčný text".
  • Vymezení (en:qualifier) je ta část tvrzení, která něco říká o konkrétním tvrzení, obvykle popisným způsobem. Vymezení může být učiněno přesným termínem podle zvláštního slovníku, ale také volnou popisnou frází (zda jsou termíny nebo fráze libovolným textem anebo částí slovníku bude asi záležet na komunitě Wikidat).

Postavení (en: rank) je kvalitativní faktor užívaný k jednoduchému výběru/filtrování tam, kde existuje více výroků pro danou vlastnost (viz Help:Ranking). Jsou tři možná postavení:

  1. Zavržené – pro výroky, které obsahují informace, o jejichž přesnosti panují pochyby, nebo je známo, že obsahují chyby. (Např. výrok, který dokumentuje nesprávný údaj o počtu obyvatel, který byl zveřejněn v historickém dokumentu. V tomto případě výrok není nesprávný - historický dokument, udaný jako reference, skutečně uvedl toto nesprávné tvrzení - ale výrok by neměl být ve většině případů užíván.)
  2. Normální – pro výroky, které obsahují relevantní a zřejmě správnou informaci, ale mohou být příliš rozsáhlé pro automatické zobrazování. (Např. historické údaje o počtu obyvatel Berlína v průběhu mnoha let.)
  3. Preferované – pro výroky s nejdůležitější a nejaktuálnější informací. Takový výrok se ukáže všem uživatelům a bude automaticky zobrazován v infoboxech Wikipedie. (Např. nejčerstvější údaje o počtu obyvatel Berlína.)

Reference (též zdroj) popisuje původ výroku na Wikidatech. Zdroj je obvykle sám o sobě položkou (např. kniha). Wikidata si nekladou za cíl odpovědět na otázku, zda je výrok správný a přesný, ale pouze na to, zda se nachází v referenci. Jaké zdroje představují platné reference, se ponechává na debatě mezi editory Wikidat.

  • External identifier Some properties have values that are strings used in other organisations' databases to uniquely identify an item. For example, an ISBN for a book or the unique part of the URL of a movie or an actor in the Internet Movie Database.

Související pojmy

  • RDF/XML je serializovaný formát RDF v XML. Viz RDF/XML.

Související odkazy (v angličtině)