Shortcut: WD:GLOSS

ウィキデータ:用語集

From Wikidata
Jump to: navigation, search
This page is a translated version of the page Wikidata:Glossary and the translation is 55% complete.

Outdated translations are marked like this.
Other languages:
العربية • ‎azərbaycanca • ‎беларуская • ‎беларуская (тарашкевіца)‎ • ‎বাংলা • ‎bosanski • ‎català • ‎čeština • ‎dansk • ‎Deutsch • ‎Zazaki • ‎dolnoserbski • ‎Ελληνικά • ‎English • ‎British English • ‎Esperanto • ‎español • ‎euskara • ‎فارسی • ‎suomi • ‎français • ‎Frysk • ‎ગુજરાતી • ‎עברית • ‎हिन्दी • ‎hornjoserbsce • ‎magyar • ‎Հայերեն • ‎interlingua • ‎Bahasa Indonesia • ‎Ilokano • ‎íslenska • ‎italiano • ‎日本語 • ‎ქართული • ‎한국어 • ‎Ripoarisch • ‎Latina • ‎Lëtzebuergesch • ‎lietuvių • ‎latviešu • ‎македонски • ‎മലയാളം • ‎Bahasa Melayu • ‎norsk bokmål • ‎Nederlands • ‎norsk nynorsk • ‎occitan • ‎ਪੰਜਾਬੀ • ‎polski • ‎پښتو • ‎português • ‎português do Brasil • ‎română • ‎русский • ‎Scots • ‎srpskohrvatski / српскохрватски • ‎српски / srpski • ‎српски (ћирилица)‎ • ‎svenska • ‎Kiswahili • ‎ślůnski • ‎தமிழ் • ‎తెలుగు • ‎ไทย • ‎Türkçe • ‎українська • ‎اردو • ‎Tiếng Việt • ‎ייִדיש • ‎中文 • ‎中文(中国大陆)‎ • ‎中文(简体)‎ • ‎中文(繁體)‎

ウィキデータは誰もが編集できる知識ベースです。このウィキデータの用語に慣れることで、誰もが(ある意味)“同じ言葉を話せる”ようになり、編集者及び開発者間のコミュニケーションが改善されるでしょう。

この用語集概念順に配列されており、出来る限りより広汎な概念から順に解説しています。アルファベット順を採用しなかったのは、これがいくつかの言語に翻訳されていて、言語により概念の名前が異なるためです。また、記載事項によっては具体的な整理の仕方が簡単に説明できない場合もあり、こうしたものに対しては「関連項目」を示しました。

名称とプロジェクト

  • ウィキメディア(Wikimedia)は、ウィキメディア・プロジェクトを通じて公衆にフリーな知識を提供する運動(詳細はリンク先参照)の名称です。
  • ウィキメディア・プロジェクト(Wikimedia projects, 詳細はリンク先参照)は特定の目的を持った自由なウィキのことで、多くの場合はウィキペディアのように言語ごとに複数のウィキに分割されています。一方ウィキデータは多言語プロジェクトです。ウィキメディア・プロジェクトには現在800ほどの個別のウィキがあります。現時点では、ウィキデータとリンクできるのはウィキメディア・プロジェクトのみです。
  • MediaWiki (メディアウィキ) は、全てのウィキメディア・プロジェクトのベースとなるソフトウェアです。そのソフトウェアは自由(原語:free)ですので、違う entities による数千のインストールです。詳しくは What is MediaWiki を参照してください。
  • Wikibase (ウィキベース) は、ウィキデータを支えるソフトウェアです。Wikibase (ウィキベース)、Wikibase client (ウィキベース・クライアント)、WikibaseLib (ウィキベース リブ) の 3 つの MediaWiki 拡張機能で構成されています。
    1. Wikibase extension (ウィキベース拡張機能) は、ウィキデータのサーバーのことで、repository (レポジトリ) あるいは単に repo (レポ) とも読んでいます。これは、ウィキデータのウェブサイト上で使用しており、MediaWiki を使って構造化されたデータを収集、および管理できるようにするものです。
    2. Wikibase client extension (ウィキベース・クライアント機能拡張) は、単にclient(クライアント)とも呼ばれます。これは、ウィキペディアなど MediaWiki で動作しているサイトにインストールするとそのページからウィキデータのデータにアクセスし、それぞれの言語に合わせて表示できるようになります。
    3. WikibaseLib extension (ウィキベース リブ拡張)はこれら両方の拡張機能に共通するライブラリ群です。

ウィキデータMediaWikiWikibase 拡張を動作させているウィキメディアのプロジェクトです。これによりウィキデータの編集者はデータを入力し、ページを閲覧できるようになります。

基本的な用語

  • データメタデータ

データとは、なんらかの符号化された情報のことです。ウィキデータは基本的に「構造化データ」やデータベースそのものを収集しています。殆ど全てのデータは、ウィキデータ編集者とbotにより、エンティティのページや公開プログラミングインターフェースを使って入力されたものです。ユーザーから見えるwikiのページや、データの入力は三つのデータ名前空間で管理しています。

  1. main(項目用)名前空間 ページとページを区別するための情報を扱い、それぞれのページがユニークな情報を格納します。
  2. プロパティ名前空間プロパティ(property) の情報を見るためのものです。これはステートメントに情報を入力して構造化するのに使用します。
  3. クエリ名前空間を使ってmain名前空間を拡張して表示する事ができるようになっています。

名前空間内のデータはWikibaseソフトウェアで入力し、コミュニティで決定し、収集している明確なモデルに基づいたデータであるため、構造化されていると言えます。

ウィキデータにあるメタデータも構造化データです。これらのデータはユーザーやbotによって作成や変更はできず、MediaWikiソフトウェアによって作成します。メタデータとしては例えば、各バージョンの履歴があり、作成した時刻やユーザー名を記録しています。

それら以外のウィキデータのページはこれまでのWikiページと同じく、構造化されていないデータ、もしくはsemi-structured data (Q2336004) View with Reasonator See with SQID (例として通常のテキストとWikiテキスト)、もしくはコミュニティの議論に使用するメタページです。

特に重要な種類のデータは「プロパティーデータ」です。

  • データセット

データセットとは、一般に、いくつかの、(構造化された)データの集まりです。

ウィキデータでデータセットと呼ばれているものは、しばしばエンティティに関連付けられています。エンティティに関連付けられたデータセットは、同一の(identity)ウィキページ(このエンティティを主題として持つデータベース内の文のセット、ウィキメディア・プロジェクト上のこのエンティティについて記述した記事のリンク、等々)に表示されている全ての情報です。

私たちはその他のデータセットをビルドできる。いくつかのエンティティのデータセットを組み合わせることによって。

データセットは異なる様式での表現が許容されます。例えばロボットやプログラム用のXMLまたはJSON形式のウィキページなどが有り得ます。

  • Dereferenceable URIs These are used during content negotiation to supply a resource description even if it is the entity itself that is addressed. This also makes it possible to supply a human-readable description or a machine readable one. The latter one would then be RDF data, according to what is more suitable. The content the dereferenced URIs point to will be available through the page Special:EntityData.
  • Export This refers to the way data and meta page content from Wikidata are made available for further consumption. The intention is to make machine-readable exports of the data available in widely used formats such as JSON or RDF/XML.
  • リンクトデータとは、相互に連結可能にすることで利便性を高めた形で発行される構造化データことです。ウィキデータの仕組みと深く関係しており、実体同士をつなげ、ウィキデータが項目についてやっているようにリンクトデータページでデータを付与するものです。
  • 三つ組(Triplet、一般にトリプルと呼ばれる)とはデータを1個の項としてリンクトデータに格納するための形式です。主語述語目的語からなります。ウィキデータでは項目プロパティがおおまかに対応します。
  • Ontology - ontology (Q324254) View with Reasonator See with SQID This is an explicit and formal specification of a conceptualization. It is important that an ontology convey a shared understanding of a domain. In Wikidata this would be given by using the properties and their intended meaning in statements to describe the real world entities and concepts, through their Wikidata counterpart, associated to literal data and other entities.
  • Provenance is the history of the contributor who added a data, and of the source from which the data was extracted. Provenance is important in the case of the reuse of Open data datasets or external database use.
  • Vocabulary This is the set of terms that is used to describe the ontology. The terms used in one vocabulary can be the same as (owl:sameAs) some terms from another vocabulary. Sameness is more strict than equality.

サイトリンク

  • Sitelink (Interlanguage link; in the user interface called List of pages linked to this item) is an identification of a linked page on another site. It consists of a site identifier and a title, and are stored in individual items in Wikidata. They are used both for identifying an item from an external site, and as a central storage of interwiki (interlanguage) links. See Help:Sitelinks.
  • Site is a reference to an external website in general, but in sitelinks it refers to specific registered wikis, for example a Wikipedia language version. Those sites are referenced by global site identifiers or for short siteid, technically corresponding to the wiki's DBname. For example the Latin Wikipedia's siteid is lawiki. Each external page can have only one link registered in Wikidata and one item can only have one link to each external site.
  • Badges are a kind of marker attached to a sitelink, which could identify, for example, that the article is a "featured article" on a specific site. They do not describe the external entity but the page on the specific site.

名前空間

  • ページ 固有のタイトルを持つ、内部または外部のウェブページ。 たとえば、ウィキペディアの主要の名前空間における記事(article)、またはウィキデータにおける主要な名前空間の項目(item)。ウィキデータ内では、the term "page" がitem または property page に言及するかもしれない。 data名前空間の内部で。他の名前空間のmeta page 、または外部linked page 、それらはウィキペディア上で、または他のウィキメディアサイト上で、または他の外部サイトで。それは、サイトリンクを使って参照されている。ウィキデータの標準名前空間にあるページは項目に使用され、1つのページには1つの項目のみが入ります。
  • Meta pages These are all pages that are not entities, i.e. do not belong to the data namespaces. Wikidata meta pages contain unstructured content represented by conventional MediaWiki code, and perhaps also future Wikidata client side inclusion code. Examples are talk pages, category pages, project pages (in the Wikidata namespace) and help pages (in the help namespace). Meta pages also comprise content and data automatically generated by the MediaWiki software (for example, the edit history of a page, or special pages).
  • 名前空間 - MediaWiki namespace (Q18889113) View with Reasonator See with SQIDであり、MediaWiki上のページ群を物理的に仕切り、ページ群を全体としての用途や追加的な振る舞いによってまとめています。名前空間の例としてはカテゴリ (Category)、ファイル (File)、利用者 (User)、さらにウィキデータの場合には項目 (標準名前空間内)、プロパティクエリの3つのデータ名前空間があります。名前空間一覧を参照してください。
  • 標準名前空間、これはすべての項目が配置される名前空間です。接頭辞がないことで他と見分けられます。

実体、項目、プロパティ、クエリ

  • Entity (in the ウィキデータのユーザーインターフェイス メッセージ sometimes called データ集合) is the データ content of a ウィキデータのページ, that either may be an 項目 (標準名前空間内), a プロパティ (Property 名前空間内) or a クエリ (クエリ名前空間内). Every entity is uniquely identified by an entity ID, which is a prefixed number, for example starting with the Q prefix for an item, and P for a property and U for query. An entity is also identified by a unique combination of ラベル and 説明 in each language. The entity can also be assigned a set of alternative multilingual 別名. (In ontologies and library catalogues that are used as reference for Wikidata, an entity is typically a real-life topic or subject, or its database representation, and corresponds in that context to what in Wikidata is called an 項目.)

項目 (item) (利用者インターフェースでは、いくつかの言語では subject, object または element と訳される。) は、現実世界の対象物(object)、概念(concept)、出来事(event)に参照させ、ウィキデータ上では、それらの対象物/概念/出来事には、1つの識別子が与えられています。(その識別子が、名前と等価です。) それぞれの項目は、対応するWikipageをウィキデータ名前空間の内部に持っています。項目は1つの prefixed id (接頭辞id)によって識別されるか(たとえば Q5)、 または外部ページへの1つのサイトリンクによって、または一意な組み合わせの多言語の ラベル および 説明によって、です。 項目は、しばしば 別名 を持ち、 lookup しやすくなっています。 項目の The main data part は、 その項目についての、その statements のリストです。1つの項目は、リンクド・データの as the subject-part of a triplet で、閲覧できます。

  • プロパティ (property) is the descriptor for a , or some other relation or composite or possibly missing value, but not the data value or values themselves. Each statement at an 項目 page links to a property, and assigns the property one or several values, or some other relation or composite or possibly missing value. The property is stored on a page in the Property namespace, and includes a declaration of the the valuetype for the property values. Compared to linked data the property express the type of predicate and the value set in the statement can be viewed as the object of a triplet. New properties are suggested and motivated at Wikidata:Property proposal. All properties should be listed at Wikidata:List of properties (WD:P). Usage of the property is also discussed at its talk page. Most properties can be mapped to Wikipedia infobox parameters and categories, see Wikidata:Infoboxes task force. The inclusion of property values in Wikipedia infoboxes (using inclusion syntax) is done for each infobox and Wikipedia version individually.

クエリ (query、質問) (将来の機能) は事前定義された項目についての検索操作です。クエリは事前定義された検索操作の記述子であり、それによって生成された検索結果の識別子ではありません。Query can be executed to asquire search results. Each search is a Entity and described and defined on its own page, and have their own prefixed identifier with prefix U. The query engine is not ready yet, as is shown by the $2 message we receive while attempting to [$1 make a new query].

識別子と言語

Many Wikimedia projects exist in different localised versions, but not Wikidata. Wikidata is multilingual, this means all parts of the user interface and also all the pages of data content can be translated into and used in many different languages. The users can determine their favorite languages. Wikidata is meant to treat all languages the same and to interconnect the knowledge of many languages allowing data content contributed in one language to be used in all the other languages as well. The users can translate all the pages into the different local languages and therefore improve the usability step by step.

  • Title This is the name of an external linked page (known as Sitelink-title), the name of a meta page, or the Entity ID of an entity page. If the page does not belong to the main namespace, the title includes the namespace name as prefix.
    1. For items, properties and queries, the Wikidata entity title is an identifier containing the namespace prefix (if any), followed by a letter and a numeric id. A title example is Property:P17 for a property, and Q6256 for an item. The page URL consists of www.wikidata.org/wiki/ followed by the title. In search results, the localized label (also known as name) is presented, followed by the identifier in parenthesis (without the namespace prefix), and by the description, to make the overall string more readable. For example, if you search for "country" using the Special:Search interface, the search result will include the property "country (P17): sovereign state of this item", as well as the item "country (Q6256), region legally identified as a distinct entity in political geography".
    2. Used for sitelinks the title is a canonical string that identifies a page on an external site. The Special:ItemByTitle interface may be used for searching a page by its title on a given Wikipedia. Together the site and title form the complete sitelink. During validation of the title the string will go through a normalization procedure, and in the end the title will be the external site's canonical page name. Only after the normalization is completed and site-specific constraints are satisfied a new sitelink can be stored.
    3. Used for an meta page in non-entity namespaces the title is spelled out as is and identifies the meta page. The namespace is normally prefixed to the string, and also to the URL. Title example is Wikidata:Glossary.
  • Language attributes
These are the language-specific labels, aliases and descriptions that are assigned to items, properties and queries. These are human-readable text to improve understanding of the scope of the item; for example the specific type of real world entity. If they are missing some of them can be replaced by strings from alternate languages, following the language fallback chains.
  • Language fallbacks (language chains)
These are methods to systematically replace missing language attributes with strings from alternate languages. The exact replacement rules can be chosen depending on the type of page, whether the user is logged in, or the user preferred languages.
  • Label
Also known as name (not to be confused with title), this is a language-specific name used for items, properties and queries. This is usually the most important name the entry is known under, or the most general or easily understandable phrase it will be known as internally to the project. Within Wikidata this takes the role of the title in Wikipedia and is used as the primary means to distinguish entries. For items it does not need to be unique, neither in the language or the overall project, but it must be unique together with the description. For properties it must be unique within the given language. Uniqueness for a combination of a label and a description is a hard constraint that must be satisfied before a change can be saved, although it may be removed in the future.
Labels should use the language specific conventions for capitalization of proper names and phrases as seems fit for the specific entry. In listings the label will be followed by the description so they join as a single list entry.
Help:Labelをご覧ください。
  • Description
This is a language-specific descriptive phrase for an item, property or query. It provides context for the label (for example, there are many items about places with the label "Cambridge"). The description therefore does not need to be unique, neither within a language or the overall project, but it must be unique together with the label. Uniqueness for a combination of a label and a description is a hard constraint that must be satisfied before a change can be saved.
See Help:Description for more information, including proper styling of descriptions.
  • 別名(英語: alias、ユーザーインターフェイスでは ⧼wikibase-aliases-label⧽')は項目プロパティクエリに対して言語ごとに定める代替的名称です。別名はラベルと同じように、参照の際に使用できます。ラベルと同じく言語固有ですが、ラベルとは異なりいくつでも付けることができます。Help:Aliasesをご覧ください。
See Help:Aliases.

主張と文

文の要素

In order to use Wikidata, the knowledge contained in different sources must be decomposed. A source might read Wolfgang Amadeus Mozart was a composer who was born 27 January 1756 and died in 5 December 1791. We need to decompose the information contained in this sentence and transform it into claims and statements: name: Wolfgang Amadeus Mozart; date of birth: 27 January 1756; date of death: 5 December 1791; occupation: composer. Both claims and (Wikidata) statements are expressed into a so called statement to be used as linked data by external websites or organization, but they are slightly refined to fit their purpose in Wikidata. Usually the statement itself in linked data is described by a single triplet, but when the statement in itself is reified, it is possible to say something more about the statement. We may say it has a value, that is our original triple (or tuple to be more general), and we may say something about that value like when and how the value is recorded or measured. Such statements about a statement is in Wikidata called qualifiers to separate them more clearly from our statements. Without doing this it could be difficult to separate the different types of statements from each other.

Statements describing references for the particular reified statement can also be made. Those are also statements about statements, but they have different roles and are also given special names. This is done by adding references. References are also reified statements so we can make statements about them, that is we can give them qualifiers. Note that references are reified statements about reified statements. It is a good thing that we can talk about references with qualifiers, that makes it somewhat clearer. (Another way to say things about references is to give them their own items and to add statements about it.)

To implement the basic assertion, the core triplet or rather the duplet as the subject is given as the item itself, a small structure called a snak is used. Those come in several versions, each specialized for a single purpose. Statements hold such snaks, and they are also the inner parts of statements about statements that is qualifiers, references and ranks. Part of the specialization for snaks is that some of them can hold a value of a special type, a datatype. A snak will refuse to hold any other type than what it is configured to store.

During the lifetime of a statement it might be set to normal, until it is deemed preferred, and later on it might be replaced by a more up to date value and marked deprecated. Those values are nothing more than statements about the reified statement, but it is given its own name and appearance in the user interface.

  • Claim is a piece of data about the entity on whose page the claim appears. A claim consists of a property (such as "Location") and a value (e.g., "Germany"), or some other relation or composite or missing value. A claim can have qualifiers, such as temporal qualifiers saying that the claim is valid within a specific time frame. Compared to the triplets used in linked data, a claim uses a property to express the predicate of a triplet and a value to express the object of a triplet. Claims form part of statements on item pages, where they can be augmented with references and ranks; they can also occur on non-item data pages.
  • Statement is a piece of data about an item, recorded on the item's page. A statement consists of a claim (a property-value pair such as "Location: Germany", together with optional qualifiers), augmented by optional references (giving the source for the claim) and an optional rank (used to distinguish between several claims containing the same property). Wikidata makes no assumptions about the correctness of statements, but merely collects and reports them with a reference to a source. See Data model and Help:Statements.
  • Values (or datavalues) are the information pieces embedded in each claim. Depending on their datatype, they can be a single value (like a number) or a value consisting of several parts (like a geographical position with longitude and latitude). In order to specify that a property has no value or a property's value is unknown, a marker (snak type) other than the default "custom value" may be selected:
Modify the snaktype (value/some value/no value) here.

値なしは、そのプロパティに対する値が存在しないことを表します。Lack of a value for a claim is very different from negation of a claim.

不明な値は、そのプロパティに対する値は存在するが、具体的な値が不明であることを表します。Some value mean that there is nothing known for the value except that it should exist and not imply a negation of the claim.

  1. カスタム値は、そのプロパティに対する値が知られていることを表します。指定できます。a snak/claim/statementを作成するとき、これは標準で、snak type です。
  • Snak is a single, basic assertion in Wikidata, including property-value assertions, "no value" assertions, and others. Statements are composed of one-to-many snaks. Snaks are an integral part of the data model, but, normally, this term will not be exposed to editors and users of Wikidata. For more information, see mw:Wikibase/DataModel#Snaks.
  • Datatype (data value type or value type) is the kind of data values that may be assigned to a property, and specifies how the data values are stored in each claim. Each property is assigned a pre-defined datatype. Not all values can be linked, as long as there are certain datatypes missing. The development of new datatypes is still in progress. See also Special:ListDatatypes for currently available datatypes.
  • 文字列(String)は文章として解釈できる自由記述の文字の列 (「こんにちは」など) です。数値として解釈できるデータ (3.14など)、項目へのリンク ([[Q1234]])、より複雑なデータ型 ({1,3,5,7} という集合など) とは異なります。ウィキデータは将来、 in addition to 文字列 データ型 サポート言語指定テキスト; プロパティのthe value としての、"単一言語-テキスト" および "多言語-テキスト" 。
  • 修飾子 (qualifier) は 主張 の一部であり、特定の主張について何かを、多くの場合記述的なやり方で、示します。修飾子は特定の語彙にもとづく用語であることもありますが、記述的な語句(自由記述もしくはウィキデータコミュニティが設定する何らかの語彙の一部)であることもあります。
  • ランクは、あるプロパティに対して複数のが存在する場合に、それを簡単に選択・フィルタリングするにあたっての品質を示す因子です(Help:Rankingを参照のこと)。ランクには3通りあります:
  1. 非推奨ランクは、信頼性に乏しい情報や、誤りを含んでいることがわかっている情報を含む文に対して用いるものです。(例えば、歴史的史料を出典とする、誤った人口など。この場合、文そのものが間違っているわけではありません。その歴史的史料には実際にその人口が記載されていたのですから。しかし、その文に含まれる情報はほとんどの場合使われるべきではありません。)
  2. 通常ランクは、正しいとみなされており意義のある情報であるものの、デフォルトで表示するにはやや仔細過ぎる情報を含む文に対して用いるものです。(例えば、ベルリンの人口の歴史的な変遷の各値。)
  3. 推奨ランクは、最も重要で最新の情報を含む文に対して用いるものです。そのような文は全ての利用者に対して表示され、ウィキペディアの基礎情報ボックスにデフォルトで表示されるべきものです。(例えば、ベルリンの最新の人口。)
  • Reference (or source) describes the origin of a statement in Wikidata. A reference is often an item in its own right; for example, a book. Wikidata does not aim to answer the question of whether a statement is correct, but merely whether the statement appears in a reference.
  • External identifier Some properties have values that are strings used in other organisations' databases to uniquely identify an item. For example, an ISBN for a book or the unique part of the URL of a movie or an actor in the Internet Movie Database.

関連用語

  • RDF/XML (アールディーエフ/エックスエムエル) は、RDF を XML としてシリアライズする形式に関する W3C 標準です。RDF/XML を参照してください。

関連項目