Wikidata:SPARQL教程

This page is a translated version of the page Wikidata:SPARQL tutorial and the translation is 38% complete.

Outdated translations are marked like this.

维基数据查询服务（WDQS）是洞察维基数据内容的一个强大工具。本指南将教您如何使用它。另可尝试维基媒体以色列提供的交互式教程。

自行编写SPARQL查询前，查阅{{Item documentation}}和其他通用SPARQL查询模板，看看所需的查询是否已有人提供。

开始之前

虽然这本指南看起来非常长且令人生畏，但请壮起胆来。了解SPARQL的基础知识就能让你走得更远——即便你在读完#迈向第一个查询后就停止阅读，你也能了解到许多有趣的查询。本教程的每个章节都能使你有能力写出更多强大的查询。

如果你以前从未听说过维基数据、SPARQL或WDQS，下方有关于这些术语的简短解释。

维基数据是一个知识数据库。它包含了数以百万计的陈述，如“加拿大的首都是渥太华”，或“蒙娜丽莎是用油彩画在杨木上的”，或“黄金的熔点是1064.18摄氏度”。
SPARQL是一种为知识数据库制定问题（查询）的语言。有了合适的数据库，SPARQL查询可以回答诸如“音乐中最流行的音调是什么？”或“哪个角色被最多的演员所描绘？”或“血型的分布是什么？”或“今年哪些作家的作品进入了公共领域？”这样的问题。
WDQS，即维基数据查询服务，将这两者结合起来。你输入一个SPARQL查询，它针对维基数据的数据集运行，并向你显示结果。

SPARQL基础

一个简单的SPARQL查询看起来像这样：

SELECT ?a ?b ?c
WHERE
{
  x y ?a.
  m n ?b.
  ?b f ?c.
}

SELECT从句列出您希望返回的变量（变量以问号开头），WHERE从句包含相关限制，主要以三元组的形式。维基数据（以及类似的知识数据库）中的所有信息都是以三元组的形式存储；当你运行查询时，查询服务会尝试将实际的值填入变量，从而呈现知识数据库中的三元组，并在返回的一个结果中呈现找到的每个变量组合。

三元组可以像一个句子一样阅读（这就是为什么它以句号结束），有一个主语、一个谓语和一个宾语。

SELECT ?水果
WHERE
{
  ?水果 它的颜色 黄色.
  ?水果 味道 酸.
}

这个查询的结果可能包括如“柠檬”。在维基数据中，大多数属性都是“具有”类型的属性，因此查询通常为：

SELECT ?水果
WHERE
{
  ?水果 颜色 黄色.
  ?水果 味道 酸.
}

which reads like “?fruit has color ‘yellow’” (not “?fruit is the color of ‘yellow’” – keep this in mind for property pairs like “parent”/“child”!).

但其实这不是WDQS的一个好例子。味道是主观的，所以维基数据没有为它设置属性。现在，让我们考虑一下“父与子”的关系，这种关系通常不存在歧义。

迈向第一个查询

假设我们想列出巴洛克作曲家Johann Sebastian Bach的所有孩子。像上面的查询一样使用“伪元素”，你会怎么写这个查询？

你或许会写成这样：

SELECT ?孩子
WHERE
{
  #  孩子 "他的父母" Bach
  ?孩子 父母 Bach.
  # （注：'#'后面的所有内容都是注释，WDQS会忽略。）
}

或者这样，

SELECT ?孩子
WHERE
{
  # 孩子（变量） "他的父亲" Bach 
  ?孩子 父亲 Bach. 
}

或者这样，

SELECT ?孩子
WHERE
{
  #  Bach "的孩子" 孩子（变量）
  Bach 孩子 ?孩子.
}

前两个三元组要求?孩子必须有父母/父亲“巴赫”；第三个要求“巴赫”必须有孩子?child。我们现在先用第二个。

那么，如何将其变为一个合适的WDQS查询呢？在维基数据中，项目和属性不是由人类可读的名称来识别的，如“父亲”（属性）或 “巴赫”（项目）。有充分的理由：“约翰·塞巴斯蒂安·巴赫”也是一位德国画家的名字，而“巴赫”也可能指的是姓氏、法国公社、水星坑等等。要找到一个项目的标识符，我们要搜索该项目，并复制结果中像是我们要找的项目的Q号（例如根据描述判断）。找到一个属性的标识符的方法相同，但要搜索“P:关键词”而不是仅仅搜索“关键词”，这样就能搜索范围限制在属性上。如此做能告诉我们，著名作曲家约翰·塞巴斯蒂安·巴赫对应的是Q1339，而指定一个项目的父亲的属性是P:P22。

最后，还有一点很重要，我们要加上前缀。对简单的WDQS三元组来说，项的前缀是wd:，属性的前缀是wdt:。以上仅适用于固定的值，变量不需要前缀。

综上所述，我们得到了首个正确的WDQS查询：

SELECT ?孩子
WHERE
{
# ?孩子 父亲 Bach.
  ?孩子 wdt:P22 wd:Q1339.
}

child	childLabel
wd:Q57225	Johann Christoph Friedrich Bach
wd:Q76428	Carl Philipp Emanuel Bach
…

自然语言	例子	SPARQL	例子
句子	Juliet 爱 Romeo。	句号	`juliet 爱 romeo.`
连词（从句）	Romeo 爱 Juliet 并且杀死了他自己。	分号	`romeo 爱 juliet; 杀死了 romeo.`
连词（名词）	Romeo 杀死了 Tybalt 和他自己。	逗号	`romeo 杀死了 tybalt, romeo.`
相对从句	Juliet 爱杀死了 Tybalt 的人。	方括号	`juliet 爱 [ 杀死了 tybalt ].`

Wikidata:SPARQL教程

开始之前

SPARQL基础

迈向第一个查询

自动完成

高级三元模式

实例和类别

属性路径

限定符

顺序（ORDER）和限制（LIMIT）

练习

Conan Doyle写的书

化学元素

流入密西西比河的河流

流入密西西比河的河流（第二课）

可选（OPTIONAL）

表达式、筛选器和绑定

数据类型

运算符

筛选器

BIND、BOUND、IF

组合（COALESCE）

分组

城市人口

绘画材料

按制造商划分枪支

按页数排序出版商

HAVING（必须）

聚合函数简述

wikibase:标签和聚合的bug

VALUES

未完待续…

参见

Navigation menu

Search

顺序（`ORDER`）和限制（`LIMIT`）

可选（`OPTIONAL`）

`BIND`、`BOUND`、`IF`

组合（`COALESCE`）

`HAVING`（必须）

`VALUES`