Wikidata:Tools/OpenRefine/Editing/New items/ja
OpenRefineでは新規の項目を作成することができます。このページではその作り方を説明しています。
危険ゾーン
- セルを照合している時にOpenRefineが何も項目を提案しないからと言って、その項目がウィキデータに存在しないということにはなりません。重複した項目を作成しようとしていないか、よく確認してください!
- 作成しようとしている項目がウィキデータで許容されるものかどうかよく確認してください。
- 項目の削除には特別な権限が必要です: 新しい項目を含む編集グループをリバートしたい場合は、管理者に依頼する必要があります。
ワークフローの概要

以下がOpenRefineで新規項目を作成する典型的なやり方です:
- カラムを照合します。
- そのセルをいくつか新規項目としてマークします。ここではまだ項目を作成している訳ではありません。多数の行を新規項目としてマークする場合は、Reconcile(照合) → Actions(アクション) → Create a new item for each cell(各セルから新しい項目を作成)の順で操作してください。
- あなたの新規項目がマークされているカラムを使って、通常通りにウィキデータのスキーマを作成します。
- 編集を実施: 新規項目はこの時点でウィキデータに作成されるでしょう。
- あなたが新規項目としてマークしたセルはここで新しく作成された項目に照合されるでしょう。
新規項目を分離してそれに専用のスキーマを使う方法はしばしば有用(必須ではありません)です。これは既存の項目を冗長な編集で乱雑にしてしまうリスクを犯すことなしに新規項目(ラベルと説明を含む)に多数の文を追加する手助けとなります。照合されたカラムのjudgmentステータス上でファセットを使って新規項目を分離し、それらへの編集を個別に実施してください。OpenRefineはいつものように、編集をウィキデータにアップロードする際には、あなたのファセットが網羅する行だけが考慮されるでしょう: セルが新規項目に照合されていてもファセットで除外されている場合は、新規項目は作成されません。[1]
あなたのカラムにある全ての項目が新規だと分かっていても、照合サービスを選んで最初の照合を通し、照合ステータスを全て"new"にセットする必要があるでしょう。最初のパートをスキップすると、OpenRefineはこのカラムがウィキデータに対して照合されるということが分からず(他のサービスへも照合することができます)、そのためウィキデータスキーマ内の項目の代わりにあなたがそれを使うことはできないでしょう。
編集はQuickStatementsでも実行できます - その場合は、あなたのOpenRefineプロジェクトは新しく作成されたQIDで更新されないでしょう。
新規項目にラベルを追加する

"new"に照合されたセル内にあるテキストは新しく作成される項目のラベルとして自動的に使われる訳ではありません。なぜならOpenRefineはこのラベルがどの言語向けなのか知る術が無いからです。 新規項目の追加時には、あなたはスキーマにラベルを明示的に追加する必要があります。このラベルは照合カラムをソースとして使えますが、もし既存項目にマッチした他のセルがあれば、これらの項目のラベルを上書きしてしまわないように注意してください(それが意図したものでなければ)。
OpenRefineはラベルなしに新規項目が作成されると(これはクリティカルな問題だと考えられるので)編集を実行するために再利用するでしょう。その項目に基本的な情報が十分与えられていない場合は他の問題が指摘されるでしょう(しかしこれらの他の警告はあなたの編集実行を妨げるものではありません)。
複数セルを同一の項目としてマークする
個々のセルを新規項目としてマークすると、セルごとにひとつの新規項目が作成されます。時には複数の行が同じ項目を参照していることがあります。OpenRefineでは対応するセルを全てsame(同一の)新規項目としてマークすることができます。2つの条件が必要です:
- 照合されたセルは同じカラムになければなりません(異なるカラムにある2つのセルを同一の新規項目とマークすることはできません)。
- セルは同じ初期テキスト値を含まなければなりません。
この2つの条件が満たされていれば、これらのセルをファセットで分離し、Reconcile(照合) → Actions(アクション) → Create one item for similar cells(同内容のセルに新しい項目をひとつ作成)の順に操作します。これでセルは新規で同じ項目を参照するようにマークされます。
新規作成された項目のQIDを閲覧する
OpenRefineで編集を実行すると、ファセットが網羅する新規セルは全てその新しいQIDで更新されます。あなたはそのQIDをEdit column(カラム編集) → Add column based on this column(このカラムに基づいてカラムを追加)の操作とcell.recon.match.idの表現を使って参照できます。このステージではあなたはもはやjudgementファセットで新しい項目を分離することはできないので(なぜならjudgmentはmatchedに更新されるので)ということに注意してください。そのため編集の実行前にこれらの行をマークする(例えばスターやフラグ)のは有意義です。
- ↑ このルールの唯一の例外は、複数セルを同一の項目としてマークしている時です: この場合は、もしそのようなセルのひとつがファセットに含まれていたら、編集が行われた際に他は全て新しく作成されたQIDで更新されるでしょう。