Shortcut: WD:GLOSS

維基數據:術語表

From Wikidata
Jump to: navigation, search
This page is a translated version of the page Wikidata:Glossary and the translation is 46% complete.

Outdated translations are marked like this.
Other languages:
العربية • ‎azərbaycanca • ‎беларуская • ‎беларуская (тарашкевіца)‎ • ‎বাংলা • ‎bosanski • ‎català • ‎čeština • ‎dansk • ‎Deutsch • ‎Zazaki • ‎dolnoserbski • ‎Ελληνικά • ‎English • ‎British English • ‎Esperanto • ‎español • ‎euskara • ‎فارسی • ‎suomi • ‎français • ‎Frysk • ‎ગુજરાતી • ‎עברית • ‎हिन्दी • ‎hornjoserbsce • ‎magyar • ‎Հայերեն • ‎interlingua • ‎Bahasa Indonesia • ‎Ilokano • ‎íslenska • ‎italiano • ‎日本語 • ‎ქართული • ‎한국어 • ‎Ripoarisch • ‎Latina • ‎Lëtzebuergesch • ‎lietuvių • ‎latviešu • ‎македонски • ‎മലയാളം • ‎Bahasa Melayu • ‎norsk bokmål • ‎Nederlands • ‎norsk nynorsk • ‎occitan • ‎ਪੰਜਾਬੀ • ‎polski • ‎پښتو • ‎português • ‎português do Brasil • ‎română • ‎русский • ‎Scots • ‎srpskohrvatski / српскохрватски • ‎српски / srpski • ‎српски (ћирилица)‎ • ‎svenska • ‎Kiswahili • ‎ślůnski • ‎தமிழ் • ‎తెలుగు • ‎ไทย • ‎Türkçe • ‎українська • ‎اردو • ‎Tiếng Việt • ‎ייִדיש • ‎中文 • ‎中文(中国大陆)‎ • ‎中文(简体)‎ • ‎中文(繁體)‎

維基數據是一個人人皆可編輯的知識庫。為了促進編者間的溝通,請先熟識維基數據術語表,讓每一位編者都能使用一致的詞彙。

術語表按照概念排序,盡可能將較爲通用的概念放於前列,而不按字母順序編排。這是因為該頁須譯為多種語言,而這些概念於不同語言中有不同的名稱。在某些情況下,如何編排條目並不顯而易見。對於此類情況,已經在合適的章節中添加了“参阅”部分。

名稱與專案

  • 維基媒體一場運動(點擊可見詳情)的名字,旨在通過維基媒體專案,爲公衆提供自由的知識。
  • 維基媒體專案 (點擊可見詳情) 是針對一個特定目的的自由維基,通常按語言劃分爲數個獨立的維基,與維基百科相同。維基數據是一個多語言維基媒體專案。維基媒體專案共有約八百個不同的維基。目前,只有維基媒體專案可以連接維基數據。
  • MediaWiki是所有維基媒體專案的基礎。作爲自由軟件,它已有上千個實例被不同的實體安裝部署。詳情請参见什麼是MediaWiki
  • Wikibase是維基數據背後的軟件。它由三個MediaWiki擴展構成:Wikibase、Wikibase客戶端和WikibaseLib。
    1. Wikibase擴展(維基數據伺服器用,常被稱爲倉庫)允許一個專門的MediaWiki實例採集和維護結構化数据。用於維基數據網站。
    2. Wikibase客戶端擴展(常被直接稱爲客戶端)使MediaWiki實例,如維基百科,能够在其自己的頁面中查詢和顯示来自於維基數據伺服器的數據。用於各種語言的維基百科與其它數個姐妹網站。
    3. WikibaseLib擴展包含以上兩個主要擴展所用的公用庫。

維基數據是一個維基媒體專案,它運行一個帶有Wikibase擴展MediaWiki實例。它允許維基數據編者輸入數據並瀏覽頁面

基本术语

  • 数据元数据

Data is raw information, like the words you are reading right now. Wikidata is essentially a collection of structured data, or database content. Those data are generally everything entered by the Wikidata editors and bots using the entity pages and the public programming interface. The wikipages from which a user can see and enter data are organized in three data namespaces:

  1. the main namespace (for items), regrouping pages in which we can see and enter information about a specific entity,
  2. the property namespace, in which we can see information about properties, which are used to structure the information we enter into statements and the
  3. query namespace, in which we can define additional ways to extract and display the information than the main namespace.

The data in those namespaces are said to be structured because they are all organized in a way that the Wikibase software uses to ensure a certain data model and because the community defines and enforces the correct ways to enter information.

Metadata in Wikidata is structured data, that can not be created or changed by users and bots but is created by the MediaWiki software. The revision history of pages is an example of metadata. The software generates the entries with time stamps and user names.

Other Wikidata pages are classical Wikipages and consist of unstructured data or semi-structured data (Q2336004) View with Reasonator See with SQID (for example: running text or wikitext), and are meta pages, such as community discussion pages.

Specifically, an important kind of data are property data. Property data are values associated with a property to build a Claim; they are an organisation unit of the structured data. Each property is assigned a Datatype, which defines the property data values that can be used in claims built with this property.

  • 數據集

A dataset is generally any collection of (structured) Data.

In Wikidata what is called a dataset is often associated to an entity: the dataset associated to an entity is all the information shown in the identity Wikipage (the set of statements in the database who have this entity as a subject, the Wikipedia links of articles describing this entity on Wikimedia projects, ...).

我们可以通过将几个实体的数据组合起来,从而构建出其他的数据集。

The datasets can be represented in different ways: as in their entity Wikipage in the form of an XML or JSON file for the robots and computing programs. Specifically in the Wikidata user interface messages, dataset refers to data associated to an entity (an item, a property or a query)

可去指向的URI被用于内容交互,用来提供一个资源的描述,即使这个URI自己就是那个资源的地址。这也使提供一个人或机器可读的描述成为可能,后者根据各种方法的适用范围,可以是RDF数据。去指向的URI指向的内容可从页面Special:EntityData获取到。

  • 导出指的是用于使来自维基数据的数据元页面内容变得可提供进一步使用的方式。其意图旨在使得所提供的这些数据的机读型导出形式采用的是广泛采用的格式,如JSONRDF/XML

链接化数据是一个发布结构化数据的方法,这样可使数据互联从而更有用。这与维基数据是如何工作的紧密相关:通过连结实体并将数据附在链接化数据页面比如维基数据之于

本体

是对特定概念化体系的明确而又形式化的详细说明。其重要性体现在,本体承载的是对于特定领域(或者说论域)的共识。在维基数据中,这将由声明中的属性来实现,从而相对于对象和原始数据,来描述外部实体(基于内部条目)。

源流是所有者的编年记录,或者还可能是群体作品之贡献者的编年记录,同时也可表示数据的源头。

词汇表是一组术语,用于描述本体。这些术语用在某个词汇表中时可能与(owl:sameAs)其他另一个词汇表中的一些术语相同。相同比相等更为严格。

站点链接

站点链接(在用户界面中被叫做链至该项的页面列表)是一个链入页面或其他维基媒体站点如维基百科各语言版本中的文章的唯一标识。它由一个网站标识符和一个网站标题构成(文章标题),且源自维基数据中单独的,且作为一个跨维基(跨语言)链接的集中化存储方式。此前,跨维基链接被存储在每个维基版本的各个文章中,由机器人定期同步,这有时会使它们不一致。维基数据第一阶段旨在将这些本地存储的跨维基链接替换为全局定义的跨维基链接,存储为维基项中的网站链接。网站链接可有附加的徽章,通常会显示出一个页面是特色条目或相似状态。参见帮助:网站链接

指向所有外部网站中的一个,但是在网链中它仅指向某些特定的已经注册的维基媒体基金会拥有的维基网站,例如某个语言的维基百科,可以很容易地被链入。全局网站标识符或者简写为网站ID指向这些网站。例如英语维基百科的网站ID是enwiki,但它跨维基代码为en:。通常前面的几个字母后面是已注册网站在维基项目内部的域名。链接到这些网站有一些限制。当前的设置下,每个外部页面只能在维基数据注册一个链接,且对于一个,每个外部站点只能有一个链接。

徽章(计划中特性)是一种标记,附加在一个网站链接上,可以表明比如对应的条目在某个网站是个“特色条目”。它们不描述外部的实体,只描述某个特定网站上的页面。

名字空间

  • 页面指一个内部或外部的带有唯一标题的网页,例如一个维基百科主名字空间的条目或维基数据主名字空间中的一个。在维基数据,术语“页面”可以指一个数据名字空间中的属性页面或一个其他名字空间的元页面或外部链入页面,它们可以位于维基百科或其他维基项目站点或一个其他外部站点,且用一个网站链接指向了它们。维基数据主名字空间中的页面都是关于的,并且一个页面只能有一个项。
  • 元页面是全部的非实体页面,即不属于数据名字空间的页面。维基数据元页面包括有传统MediaWiki代码表示的非结构化内容,可能还包括未来的维基数据客户端包含代码。诸如讨论页、分类页、工程页(在维基数据名字空间)和其他帮助页(在帮助名字空间)。元页面还可包含由MediaWiki软件自动生成的内容和数据,例如页面编辑历史或特殊页面

名字空间MediaWiki中页面的物理区划,它们根据全局的使用或者附加功能来聚合页面。例如分类文件用户的名字空间,而对于维基数据,有三个数据名字空间:(在主名字空间中)、属性查询。见名字空间列表

  • 主空间是所有所在的名字空间。它的特徵是沒有前綴。

实体、项、属性和查询

实体(在维基数据用户界面信息中有时被称为数据集)是维基数据页面中的数据内容,且可以是一个(在主名字空间)、属性(在属性名字空间)或查询(在查询名字空间)。每个实体都由一个实体ID唯一确定,它是一个有前缀的数,例如项是前缀Q起始、属性是P而查询是U。一个实体亦可由各语言中唯一的标签描述的组合区分出来。还可为实体分配一组多语言的别名。(在本体和作为维基数据中的参考存在图书馆编目中,一个实体一般是现实生活一个话题或主题,或它在数据库中的表示,并且与之匹配的那个背景下维基数据中的的事物被称为一个

是一个维基数据主名字空间中的页面,代表现实生活中的一个“话题”,“概念”或“主题”。项由一个有前缀的id,一个网站链接或者一个唯一的多语言标签说明的组合所确定。项亦可有别名,方便查找。项的主要数据部分是关于该项的声明列表。项可被视为链接化数据三元组的主题部分。

属性是一个说明符,用于描述数据值、关系、组合或可能的无值,但属性不是数据值或值本身。页面的每个声明都链接到一个属性,并且赋予该属性一个或数个值、关系、组合或可能的无值。属性储存在属性名字空间中的页面内且包括了一个属性值的类型申明。与链接化数据相对应,属性代表了一个三元组的断言。

查询(未來功能)是一个間的预定义搜索。查询是该预定义搜索的描述符,而非搜索產生的结果。可执行查询获取搜索结果,这会有助于列表文章的自动生成与翻译。见维基数据:列表任务组(维基数据第三阶段)。每个查询都是一个实体並在它自己的页面被定义和描述,且有自己的前缀标识“Query:U”。查询引擎仍未就绪,如我们试图[$1 做一个新查询]时消息$2所显示。

Identifiers and languages

Many Wikimedia projects exist in different localised versions, but not Wikidata. Wikidata is multilingual, this means all parts of the user interface and also all the pages of data content can be translated into and used in many different languages. The users can determine their favorite languages. Wikidata is meant to treat all languages the same and to interconnect the knowledge of many languages allowing data content contributed in one language to be used in all the other languages as well. The users can translate all the pages into the different local languages and therefore improve the usability step by step.

标题是外链页面的名称(被称为站点链接标题)、元页面的名称或者一个实体页面的实体ID。如果一个页面不属于主名字空间,标题则包括“名字空间:id”。

    1. 对于属性查询,维基数据实体标题是一个标识符,包含名字空间前缀(如果有),及紧跟着的一个字母和一个数字id。例如“Property:P17”是一个属性标题,“Q6256”是个项标题。页面URL即“www.wikidata.org/wiki/”加上标题。在搜索结果中,会显示本地化标签(也称名字),后面跟着括号扩着的标识符(没有名字空间前缀)和说明,使得整个字符串更加易读。

用于网站链接时,标题是一个规范的串,它唯一地标识出一个外部网站中的页面特殊:按标题查找项界面可以用于搜索某个给定的维基百科中的某个页面之标题。网站标题一起组成了完整链接。在确认标题的过程中,串会经过一个标准化过程,最终标题会成为外部站点的规范页面名称。只有标准化过程结束且网站相关限制满足后,一个新的网站链接才会存入。

用于非实体名字空间中的元页面时,标题唯一标定这个元页面。名字空间一般前缀在串之前。标题示例是“维基数据:词汇表”

语言属性属性查询中指明语言的标签别名说明。这些都是人类可读的文字,用以改善对该项所在领域的理解,比如现实世界中实物的某个特定类型。它们缺失的部分,如果存在缺失的话,可以由候补语言链中其他语言的串替代。

语言备选语言链)是系统地用其他语言中的串替换缺失语言属性的方法。精确的替换规则由页面类型、用户是否登录或用户偏好语言选定。

标签

也称为“名称”(不要与标题相混淆)是属性查询中指明语言的名字。这通常是该条目为人所知的最重要的名字,或者某个工程内部最通用或最易于理解的短语。在维基数据标签承担了维基百科中标题的角色因此是区分条目的最主要的方式。项的标签在某个语言内或整个维基数据中都不一定唯一,但标签结合说明一定要是唯一的。而对于属性和查询(还未定义),标签在给定的语言内一定是唯一的。标签和说明之组合的唯一性是一个硬性限制,必须满足否则改动无法保存,虽然这个限制将来可能被移除。
标签应当使用特定语言的专有名称和短语之大写惯例,使之与特定的条目相适应。在列表中,描述可能紧跟在标签之后因此它们结合为一个单独的列表项。标签和说明均可单独地提取和使用。

帮助:标签

参见Help:标签

说明

这是属性查询中的一个语言特定的描述性短语。它为标签提供了背景信息。(例如,有许多关于地点的项具有标签“剑桥”)。因此描述并不需要唯一,在某个语言中或整个维基数据中都是如此,但是它与标签一起必须是唯一的。标签和描述之组合的唯一性是一个硬性限制,必须满足否则改动无法保存。

详见帮助:说明,包括了说明的合适风格。

See Help:Description for more information, including proper styling of descriptions.

别名

在用户界面被标记为⧼wikibase-aliases-label⧽。是属性查询中指明语言的其他名字,可以像标签(标题)一样被用于搜索。与标签类似,别名也是语言特定的。不过与标签不同的是,别名需要多少就可以有多少。

帮助:别名

參見Help:別名

声称与声明

声明元素

In order to use Wikidata, the knowledge contained in different sources must be decomposed. A source might read Wolfgang Amadeus Mozart was a composer who was born 27 January 1756 and died in 5 December 1791. We need to decompose the information contained in this sentence and transform it into claims and statements: name: Wolfgang Amadeus Mozart; date of birth: 27 January 1756; date of death: 5 December 1791; occupation: composer. Both claims and (Wikidata) statements are expressed into a so called statement to be used as linked data by external websites or organization, but they are slightly refined to fit their purpose in Wikidata. Usually the statement itself in linked data is described by a single triplet, but when the statement in itself is reified, it is possible to say something more about the statement. We may say it has a value, that is our original triple (or tuple to be more general), and we may say something about that value like when and how the value is recorded or measured. Such statements about a statement is in Wikidata called qualifiers to separate them more clearly from our statements. Without doing this it could be difficult to separate the different types of statements from each other.

Statements describing references for the particular reified statement can also be made. Those are also statements about statements, but they have different roles and are also given special names. This is done by adding references. References are also reified statements so we can make statements about them, that is we can give them qualifiers. Note that references are reified statements about reified statements. It is a good thing that we can talk about references with qualifiers, that makes it somewhat clearer. (Another way to say things about references is to give them their own items and to add statements about it.)

To implement the basic assertion, the core triplet or rather the duplet as the subject is given as the item itself, a small structure called a snak is used. Those come in several versions, each specialized for a single purpose. Statements hold such snaks, and they are also the inner parts of statements about statements that is qualifiers, references and ranks. Part of the specialization for snaks is that some of them can hold a value of a special type, a datatype. A snak will refuse to hold any other type than what it is configured to store.

During the lifetime of a statement it might be set to normal, until it is deemed preferred, and later on it might be replaced by a more up to date value and marked deprecated. Those values are nothing more than statements about the reified statement, but it is given its own name and appearance in the user interface.

  • 声称是关于实体的一些数据,在其页面上可看到声称。一个声称由一个属性(如“地点”)和一个(如“德国”)或其他关系、组合或无值构成。一个声称可有限定符,如时间限定符表明该声称在一定时段内有效。与链接化数据中的三元组相对应,一个声称用一个属性表示三元组中的断言、一个值表示三元组中的对象。声称组成了页面中的声明,并可由参考排序补充;它们还可存在于非项数据页面。
  • 声明指记录在某个项的页面之上、关于某一的一些数据。一则声明由一个声称(即属性值对如“地点:德国”,与可选的修饰之组合)构成,加上可选的参考(给出声称的来源)和一个可选的等级(用于区分数个具有相同属性的声称)。维基数据并不对声明的正确性做出任何假设,而仅仅收集、记录这些声明,及一个指向来源的参考数据模型帮助:声明
  • (或称数据值)是嵌入在每个声称内的具体信息。根据它们的数据类型,它们可以由单个(如一个数字)或多个数据值(如地理位置具有经度与纬度)组成。在系统内部它们通过连接符与声称相关连。
修改snaktype(值/部分值/无值)这里。

无值是一个不清楚是否有已知的属性值的标记。值的缺乏的要求是非常不同的否定要求。

未知值是一个标记,当某属性的值存在但精确值未知时使用。一些属性的意思是这里除了应该存在以及意味着否定的说明外没有已知的值。

自定义值是一个标记,当某属性有一个已知值时使用。

连接符是值、声明声称之间的内部抽象层,其中的值包括无值、与未知值。用户界面中通常看不到这个抽象层,但是它会是REST API中数据的可见导入。更多信息请参阅元维基

数据类型数据值类型值类型)是可以被赋值于属性的数据的种类,且指明了数据值如何在声称中存储。每个属性都被分配了一个预定义的数据类型。另见Special:ListDatatypes,查看当前支持的数据类型。

  • (簡自「字符串」)是被譯為文本的(如“你好”)任選字符序列的普遍術語,——与之对应的是一条被解析为数值的数据(3.14)、到其他项的链接(如[[Q1234]])或一个更复杂的数据类型(集{1,3,5,7})。维基数据将支持数据类型“单语言文本”和“多语言文本”,两者都被视为串数据类型及属性
  • 限定符声称的一部分,它们明确了关于某个声称的一些事项,通常以一种描述性的方式。一个限定符可以是一个词汇表中的术语但也可以是不同的描述性短语(这些术语或短语是任意文字还是一定是某个词汇表的一部分取决于维基数据社区)。

是一个质量系数,在给定許多属性的声明中,用于简单选择/过滤这些声明。有三种可能的级:

  1. 弃用级用于一则声明,这则声明包含被认为可能不可靠或已知有错的信息。(例如,一则声明记录了一个发表在某历史档案中的错误的人口数据。在这种情况下,这则声明不是错误的–那个作为参考给出的历史档案导致来错误的声称–但是这则声明不应在大多数情况下使用。)
  2. 普通级是用于一则声明,它包含公认正确的相关信息,但是可能太泛而不被默认显示。(例如,很长时间内,柏林的一个历史人口数据。)
  3. 首选级是用于一则具备最重要、最新信息的声明。这样的声明所有用户都可见并且会默认显示在维基百科的信息框里。(例如,柏林的最新人口数据。)

参考(或称“来源”)指维基数据中某项声明的源头。来源往往本身是个;如一本书。维基数据并非旨在回答关于某项声明正确与否的问题,而仅仅回答相应声明是否由某一参考给出。而究竟什么才是有效的参考,预计将成为维基数据编者之间争论的一个问题。

  • External identifier Some properties have values that are strings used in other organisations' databases to uniquely identify an item. For example, an ISBN for a book or the unique part of the URL of a movie or an actor in the Internet Movie Database.

相关术语

  • RDF/XML是XML格式的RDF的一种序列化格式。参见RDF/XML(英文版)。

另見