Wikidata:Tools/OpenRefine/Editing/Tutorials/Third-party reconciliation/ja

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Tools/OpenRefine/Editing/Tutorials/Third-party reconciliation and the translation is 94% complete.

インポートしたいデータのソースが巨大なことがよくあります。例えば、法人登記管理者などのデータソースはウィキデータが対応する領域で持っているよりもはるかに多くのレコードを持っています。そのような場合には、ソースデータベースをOpenRefineにロードしたり、ウィキデータと照合する通常のワークフローは全く非現実的です - データベースが巨大すぎ、照合は何年も掛かり、適切なマッチングが行われるのは極めて稀です(なぜならソースデータベースにある大多数のレコードはウィキデータには存在しないからです)。

このチュートリアルではそうした問題に取り組む方法を説明します: 私たちは代わりに対応する領域を対象とするSPARQLクエリで既存のウィキデータ項目を抽出し、私たちのデータソースに対してこれらの項目を照合します。私たちのゴールはVIAF ID (P214)GND ID (P227)といった典拠管理識別子を人物に関する項目に追加することです。私たちは LOBID照合サービスを使います。これでIntegrated Authority File (Q36578) (GND)に対してレコードを照合することができます。

対象項目をSPARQLクエリで抽出

ドイツの研究者のリンク改善に興味があるとします。私たちはGND ID (P227)の無いドイツの研究者のリストをこんな風に参照できます:

SELECT ?item ?itemLabel WHERE {
  ?item wdt:P31 wd:Q5;
        wdt:P106 wd:Q1650915;
        wdt:P27 wd:Q183.
  FILTER NOT EXISTS { ?item wdt:P227 ?gnd }
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
} LIMIT 100
Try it!

もちろん、このクエリ(とその上限)は任意です - 私たちは同様にブラジルの組織やラトビアの場所を探すことができます。ゴールはシンプルに対象のデータベース内にエントリーがありそうな項目に対する領域を絞り込むことです。

GNDを使った照合

このクエリの結果をOpenRefineにインポートします。最初のカラムにはQIDが含まれ、これはウィキデータに直接照合できます(Reconcile(照合(名寄せ))Start reconciling(照合(reconcile)を開始)からウィキデータサービスを選びます)。私たちは2番めのカラムも照合しますが、今度はGNDそれ自身に対してです。そのために、Reconcile(照合(名寄せ))Start reconciling(照合(reconcile)を開始)をクリックしてAdd standard service(サービスを追加)。 LOBIDが運営するGND照合サービスのアドレスを使います: https://lobid.org/gnd/reconcile

新しい照合サービスを追加するダイアログのスクリーンショット

ウィキデータ向けと同様に、あなたは型で照合を制限し、プロパティを介して精度を上げることができます(詳細はサービスの文書参照)。これであなたはGNDに対して項目をマッチさせることができます:

LOBIDでの照合プロセスのスクリーンショット

識別子を閲覧

項目とマッチさせたら、cell.recon.match.idの表現でカラムを追加してGNDのIDを取得したり、cell.recon.match.nameでGNDの参照名を取得したりできます。あなたはAdd columns from reconciled values(照合値からカラムを作る)操作を使って、この情報(およびそれ以上)を取得することもできます:

GNDからデータをフェッチするダイアログのスクリーンショット

ウィキデータへのID追加

次に私たちはスキーマを作成してウィキデータに識別子を追加することができます。あなたは項目に対する別名としてGNDの参照名を追加することもできます:

IDを追加するためのスキーマ例

これにより次の編集候補が得られます:

実施された編集のプレビュー

そして、これらの編集はウィキデータにアップロードできます。

その他の照合可能なデータソース

様々な他のソースに照合サービス経由でクエリを投げることができます。こちらにいくつかあります:

照合テストベンチ内で他の照合サービスを探すことができます。

他のデータベース用に、あなた自身の照合インタフェースを作成することもできます。例えば reconcile-csvconciliatorを経由したり照合APIを自分で実装したりすることで。