Wikidata:井戸端

From Wikidata
Jump to navigation Jump to search
ウィキデータ 井戸端
ここでは、ウィキデータに関するあらゆる話題を取り扱います。例えば、プロジェクト自体についてや、方針、提案、特定のデータ項目、技術的な問題、その他についてです。

ある程度の時間のたった議論は過去ログへ移動されます。

過去ログ

Contents

Identification or creation of items for Japanese painters[edit]

Sorry for my writing in English. The Wikidata:WikiProject sum of all paintings tries to describe a lot of paintings with their creators. The Los Angeles County Museum of Art (Q1641836) has a great collection of Japanese and Chinese art and some of it was just imported to Wikidata. Though it is very difficult to find the items for the creators of the works. Probably many of them have yet to be created. Is there somebody here who could go through a list of creator names and look for possibly existing pages on jawiki/items on Wikidata and for the correct Japanese label if there is no item yet? That would be great! A list of all problem cases in Los Angeles County Museum of Art (Q1641836) is at User:Multichill/Los Angeles County Museum of Art missing painter. Thanks in advance, --Marsupium (talk) 11:42, 23 January 2016 (UTC)

Merge?[edit]

Can ja:斉藤隆三 and ja:斎藤隆三 be merged? They had shown up on Wikidata:Database reports/identical birth and death dates/1.
--- Jura 05:48, 23 February 2016 (UTC)

→ ← Merged. Thank you for reporting. --本日晴天 (talk) 12:19, 23 February 2016 (UTC)

重複したWikidata項目の削除について[edit]

ロウィン (Q16159965) と ロウィン (Q22985853)が重複しているため、後者の方を削除願います --Namemiso (talk) 10:10, 2 March 2016 (UTC)

→ ← Merged no label (Q22985853)Rowin (Q16159965)へ統合しました。項目が重複している場合は一方を削除するのではなく、統合を行った上で一方をもう一方のリダイレクトにします。--本日晴天 (talk) 12:46, 2 March 2016 (UTC)

早急な対応ありがとうございます。 --Namemiso (talk) 11:14, 3 March 2016 (UTC)

過去ログ化しましょう[edit]

過去ログ化しましょう。とりあえず、固定リンク 2016年3月3日 (木) 11:15の版 。2015年の議論は、過去ログ送りにしましょう。なお、英語版の井戸端 Wikidata:Project chat だとサブページを作成する方法で、過去ログ送りにしてます。日本語版では、どうしましょうか。--すじにくシチュー (talk) 17:20, 7 March 2016 (UTC)

とりあえず、過去ログ化として、2015年末までの議論を消去して、かわりに冒頭部に過去ログとしての固定リンクを配置しました。もし問題点があれば、差し戻しなどしてください。--すじにくシチュー (talk) 13:49, 9 March 2016 (UTC)


instance of (P31)[edit]

Ryūkō Shunpūtei (Q11513878) and no label (Q11413137) appeared on lists for people. As they don't appear to be about individuals, I removed instance of (P31)=human (Q5). What would be good values for P31? --- Jura 12:31, 15 March 2016 (UTC)

Maybe this solves it: Wikidata:Property_proposal/Person#professional_name_.28Japan.29. Please comment there. --- Jura 07:22, 3 May 2016 (UTC)
The sample is somewhat random, one I just came across. I would be glad if a few good ones would be added instead. --- Jura 12:38, 7 May 2016 (UTC)

Wikidata:Requests for comment/Reforming the property creation process[edit]

See the above RFC for some proposals to reform the property creation process. MediaWiki message delivery (talk) 06:29, 20 March 2016 (UTC) (on behalf of Rschen7754)

Merge ?[edit]

Are these about the same person? no label (Q11520411) and Motoki Shōzō (Q11518618).
--- Jura 17:39, 23 May 2016 (UTC)

重複したWikidata項目の削除について[edit]

Template:Cc-by-4.0 (Q15243503) と テンプレート:CC-BY-4.0 (Q26224898)が重複しているため、後者の方を統合の上削除願います--Sakoppi (talk) 14:39, 6 August 2016 (UTC)

  • → ← Merged 統合を実施しました。統合元の項目は削除せずにリダイレクトとして存続させることになっています。詳しくはHelp:Redirects/jaをご覧ください。統合のやり方についてはHelp:Merge/jaをご覧ください。--本日晴天 (talk) 08:50, 7 August 2016 (UTC)

Wikidata:Database reports/without claims by site[edit]

This list has now a category list for Japanese Wikipedia: items without claims categories/jawiki.

The links on the report can help add statements to all items in these categories without any statement.
--- Jura 21:44, 8 August 2016 (UTC)

I added a few category combines topics (P971) values to these categories. Together with the qualifier see also (P1659), these add a few links for statements to add to these categories.
--- Jura 22:55, 9 August 2016 (UTC)

日本由来の姓名[edit]

ラテン文字表記の日本由来の姓名で、ウィキペディアへのサイトリンクがある姓名の項目のjaラベルはカタカナ、ひらがな、ラテン文字いずれがいいでしょうか?Q21507894ではカタカナにしたのですがQ8061661ではひらがなになっています。カタカナにした理由はラテン文字表記の日系の人物などは日本語ではカタカナに転写されるからなのですが。--Afaz (talk) 01:59, 10 August 2016 (UTC)

名前についての知識があるわけではないのですが、氏名(姓+名)はひらがなとカタカナを各人に応じて当然使い分けるような気がしますが、構成要素としての姓、名は困りますね。日本の名についてはWikidata_talk:WikiProject_Names#Japanese namesの議論でも話があがっているようですが、斜め読みした感じではすっきりしていないようですね。 姓についてはともかく、名については数が膨大すぎて、手を付けたいとは思いませんが、今時点では読みで1項目に割り当ててる方がWikidata:情報価値に照らしてもいいような気がします。そういった前提では「Tomoaki (Q7820080)」のようにtransliteration (Q134550)を併用して作成済の名は「has part (P527)」でつなげ、JAラベルはAfazさんが書かれてるように外語由来の転写ということで、表記を「カタカナ」という考えが個人的にはフィットします。(単なる私的意見ですが。) --Camillu87 (talk) 11:57, 14 August 2016 (UTC)

subclass of (P279)instance of (P31)の日本語のラベルについて[edit]

日本語のラベルは、subclass ofを「上位クラス」、instance ofを「分類」としていて、確かにこれ自体は簡潔でわかりやすいのですが、これでは「クラス」と「インスタンス」という概念の存在を隠してしまい、データを扱う上ではかえって分かりにくくなっているような気がします。例えば、subclass ofを「以下の(クラスの)下位クラス」、instance ofを「以下の(クラスの)インスタンス」などとするのはいかがでしょうか。日本語としてはまどろっこしい表現になりますけれども…… --Okkn (talk) 15:39, 16 August 2016 (UTC)

問題提起としては同感です。以前はinstance of (P31)は「以下の実体」でしたが、個人的には連想しやすいのでこちらが好みですが、カッコ抜きの「以下の下位クラス」、「以下のインスタンス」でもいいように思います(Help:基本特性をにらめっこしながら..)。また「facet of (P1269)」も「親項目」となっていますが、「subclass of (P279)」、「part of (P361)」とかと混乱しそうで、「以下の一面」とかに変えてはどうでしょう?。(参考:Wikidata:List_of_properties/all/ja)--Camillu87 (talk) 14:44, 18 August 2016 (UTC)
日本語文法の制約を受けてどうしてもすっきりしない表現を余儀なくされますね…。ただクラスやインスタンスを意識できさえすれば良いと思うので、Camillu87さんの表現は悪くないと思いました。--朝彦/Asahiko (talk) 01:42, 30 August 2016 (UTC)
Pictogram voting comment.svg Comment トリプレットの「述語」部分をそのまま直訳すると日本語として変な表現になるので、現在の「上位クラス」「分類」でいいと思います。クラスとインスタンスの概念はプロパティの「説明」に記述されていればデータを扱う側は分かります。それと本題からそれますが、インスタンスとエンティティはどちらも実体と訳されているところがあるので、訳語を統一する必要があると思います。instanceはインスタンス、entityはエンティティでいいと思うのですが。--Afaz (talk) 07:37, 2 September 2016 (UTC)
「上位クラス」は私もいいと思うのですが、「分類」は果たして適切な訳語と言えるでしょうか。「分類」と言われると、class - instance の関係だけだけでなく、class - subclass も含むような印象を私は受けてしまいます。 --Okkn (talk) 17:24, 13 September 2016 (UTC)

バッジの割り当てのお願い[edit]

Ikei Island (Q4518662)が日本語版で良質な記事に選出されたため、バッジの割り当てをお願いいたします。Kugel~wikidatawiki (talk) 09:45, 2 September 2016 (UTC)

  • ✓ Done バッジを追加しようとしたところ編集フィルターに引っかかったのですね。私の方でバッジを追加しました。--本日晴天 (talk) 11:54, 2 September 2016 (UTC)
    • 対応していただき、ありがとうございました。Kugel~wikidatawiki (talk) 12:05, 2 September 2016 (UTC)

訳語の統一[edit]

理解のために翻訳を始めたのですが、よく出る単語や用語について訳語を揃えられればと思い下記のようにまとめてみました。訳語の妥当性等、ご意見お願いします。(ここに表を記載するのが不適切でしたらどこかに移してリンクしますのでご指摘ください)

英語 訳語 表記ゆれの例 備考
alias 別名
authority control 典拠管理
bot ボット bot
claim 主張
datatype データ型 データタイプ、データ種別
description 説明
entity エンティティ 実体、要素
identifier 識別子  
instance インスタンス 実体、実例、要素
interlanguage link 言語間リンク
interwiki ウィキ間リンク
interwiki conflict 言語間リンクの衝突
item 項目 item
label ラベル
linked data リンクト・データ リンクトデータ
MediaWiki メディアウィキ MediaWiki
merge 統合
ontology オントロジー
property プロパティ
qualifier 修飾子
query クエリ
rank ランク
reference 出典 参照、参考
repository リポジトリ レポジトリ
site サイト
sitelink サイトリンク
source 情報源 ソース、出典
statement
string 文字列
title タイトル 題名
value
vocabulary 語彙
Wikibase ウィキベース Wikibase
Wikidata ウィキデータ Wikidata
Wikimedia ウィキメディア Wikimedia
Wikimedia commons ウィキメディア・コモンズ Wikimedia commons
Wikipadia ウィキペディア Wikipadia
Wikiquote ウィキクォート Wikiquote
Wikisource ウィキソース Wikisource
Wikiversity ウィキバーシティ Wikiversity
Wikivoyage ウィキボヤージュ Wikivoyage

Higa4 (talk) 10:23, 7 September 2016 (UTC)

  • 2点ほど意見を。1点目は、"interwiki" が「ウィキ間リンク」なのに対して "interwiki conflict" が「言語間リンクの衝突」になっているのは、実際に "interwiki conflict" という言葉が使われている場面でその殆どが言語間リンクに関するものだからでしょうか?個人的には "interwiki conflict" を「ウィキ間リンクの衝突」に揃えたく思います。 2点目は "source" について、Wikipediaのインターフェースなどにおいても「出典」という訳語がよく見られますので、「情報源」よりもそちらをメインの訳語にしたほうが良いのではないかと思います。 --Okkn (talk) 17:06, 13 September 2016 (UTC)
    • コメントありがとうございます。"interwiki conflict" を「言語間リンクの衝突」としたのはそのような訳例があったのでそのまま転記したのですが、ご指摘の通り「ウィキ間リンクの衝突」の方が本来的な訳ですね。特に用語的に問題なければ「ウィキ間リンクの衝突」とさせて頂ければと思います。2点目は"source"を「出典」とすると"reference"の訳語とかぶることもあり、あえて「情報源」として区別したのですが、いかがでしょうか。Higa4 (talk) 15:23, 16 September 2016 (UTC)
  • 一時的に議論するのは、目につきやすい井戸端でいいと思いますが、Wikidata talk:Glossary/jaにこちらの節へのリンクを記載しておいてほしいです。またinterwikiは、別々のウイキをつなぐ意味でウィキ間リンクとされていますが、w:Help:言語間リンクを見ると書式を表すw:インターウィキという場合あると思います。その意味ではinterwiki conflictは、「インターウイキ(部分)の衝突」かと思いますが、意訳して何がいいのか決めがたいです。--Camillu87 (talk) 05:34, 18 September 2016 (UTC)
    • ご指摘ありがとうございます。リンクを記載しました。"interwiki conflict"については当方はまだ知識不足のため引き続きみなさまのご意見をお伺いできればと思います。なお”Wikivoyage”は一般的に「ウィキボヤージュ」と表記されているのに気づいたので「ウィキボヤージ」から修正しました。--Higa4 (talk) 16:07, 18 September 2016 (UTC)
      • リンクへの対応ありがとうございました。--Camillu87 (talk) 13:50, 20 September 2016 (UTC)
  • Help:基本特性の翻訳作業中にinstanceという語について、「実体」という訳がリストにある横文字表記に対して優勢を保っていたので追加しておきました。個人的には「実体」表記のほうが性質がわかりやすいように感じられるので好みなのですが、↑で為されている議論に代表されるようにこのページでは「インスタンス」派が優勢であるようにお見受けします。どちらかに統一すべきかと感じるのですがいかが致しましょう(私はclass-instanceの概念の説明を行う件の記事について、私が翻訳を開始する前から見受けられた「実体」表記のほうを支持します)。--AraigumaG (talk) 04:21, 18 January 2017 (UTC)
    • 「実体」は日本工業規格などでもentityの訳語になっているので、instanceを「実体」とするのは問題があると思います。--Afaz (talk) 13:37, 22 January 2017 (UTC)

country of citizenship (P27) = Japan (Q17) ?[edit]

SELECT ?item ?itemLabel
{
  	?item wdt:P570 ?dod .
	FILTER ( ?dod > "1960-01-01T00:00:00Z"^^xsd:dateTime) 
  	OPTIONAL { ?item wdt:P27 ?nat } . FILTER(!BOUND(?nat))
	?article schema:about ?item ;	schema:isPartOf	<https://ja.wikipedia.org/> .
	?item wdt:P31 wd:Q5 . 
  	SERVICE wikibase:label { bd:serviceParam wikibase:language "ja,en" }
}

Try it!

Maybe there is a way to complete some of the above 15000 items with a country of citizenship (P27) statement based on one or the other category in jawiki.

With PetScan (Q23665536), it's easily possible to limit it to items that have a sitelink only to jawiki (12866 items): https://petscan.wmflabs.org/?psid=255776

Sample to add P27:Q17 based on ja:Category:日本の映画監督

Maybe there are more suitable categories.
--- Jura 15:33, 18 September 2016 (UTC)

Wikidata:Database reports/Recent deaths/missing/P21[edit]

Frequently, the list has entries related to jawiki.
--- Jura 05:05, 28 September 2016 (UTC)

Wikidata 4周年: 六本木ヒルズで集まり[edit]

今日の参加者

Wikidataの4周年を軽くお祝いするため、世界中にカジュアルな集まりがあります

日本では、明日10月28日に東京の六本木ヒルズで「弁当ランチ」という形でやってます。

  • 場所:六本木ヒルズのメトロハットの地下2階の誰でも使えるテーブル(写真)。「W3C」ステッカーが目印です。
  • 時間:12時〜13時
  • 会費:無料。食べたい方は自分の弁当を持ってきてください。近くに美味しいのが売ってます。
  • 内容:何人かがWikidataやOpenStreetMapや関連プロジェクトで何をするか簡単に説明します、主に日本語で。ところで、Wikidataの経験がなくても大丈夫です。

楽しみです! Syced (talk) 03:54, 27 October 2016 (UTC)

議事録[edit]

無事に終わりました!

  • 3人参加
  • OpenStreetMap、Google Maps、Baidu Mapsの話
  • 近くのNogi Shrine (Q3342690)を編集。主祭神や社格に当たるプロパティを調査、検討、決定。この項目が手本になって、それに伴って神社何千件を編集する予定(すでに始めました)
  • Harvest Templates、WDFIST、WikiShootMe!、Wikidata Gameの紹介
  • 次回のWikidataの話は来月、横浜で

Syced (talk) 08:04, 28 October 2016 (UTC)

    • 議事録にある「横浜」のイベントのご案内です。2016/11/19(土)16時より1時間ほど、横浜市金沢区総合庁舎にて下記イベントのひとコマでwikidataのお話をさせて頂きます。 http://summit2016.code4japan.org/ 内容はウィキデータの概要紹介とちょっとしたハンズオンを予定しています。もしよろしければお越しください。その後懇親会もありますのでウィキデータについて諸先輩方にいろいろお話を聞かせて頂けるとうれしいです。 --Higa4 (talk) 04:18, 8 November 2016 (UTC)

ラベルの文字[edit]

ラベル、説明、別名の入力時に特定の文字が含まれるとエラーとなり、入力できないようですね。Wikidata:Project chat(Validation failed: Negative pattern matched: /^\s|[\v\t]|\s$/ など)で、話題が上げられていますが、「者」、以外にも「配」、「共」でも文字が含まれていると入力できません。(日本語版にも話題共有のため、挙げておきます)--Camillu87 (talk) 04:53, 26 March 2017 (UTC)

修正されたようですね--Camillu87 (talk) 14:14, 29 March 2017 (UTC)
来週月曜日のtech newsにて全プロジェクトに報告が入りますが、phab:T161263で修正が行われたようです。--mirinano (talk) 05:42, 1 April 2017 (UTC)

Android用ウィキペディアアプリでのウィキデータ項目の「説明」の編集[edit]

Android用Wikipediaアプリでウィキデータ項目の「説明」の編集機能が公開されました。この変更は主にウィキデータに影響がありますが、ウィキペディアのモバイル版の懸念事項にも関連しています。そのため、モバイル版利用者がページのタイトルの下や検索結果に表示される「説明」を直接編集できるようになります。

数か月前にウィキペディアのパイロットグループ(ロシア語版、ヘブライ語版、カタロニア語版)にこの機能を有効化し、その後アプリの使用数上位10のウィキペディア以外のすべてのウィキペディアに展開しました。その結果はとても肯定的なものでした。数例を挙げると、新規あるいは更新された「説明」で質の向上をもたらす無数の編集があり、荒らし編集の比率も低く抑えられています。

我々は、この機能の次のフェーズとして、これから数週間にわたりドイツ語版、イタリア語版、フランス語版、スペイン語版、日本語版、オランダ語版、ポルトガル語版、トルコ語版、中国語版のウィキペディアで有効化する準備を整えました。英語版のウィキペディアへの展開は今年の下半期に予定しています。いつものように懸念事項があるときは、このプロジェクトのトークページか reading@wikimedia.org 宛の電子メールでお問い合わせください。よろしく!

-DBrant (WMF) 09:09, 21 June 2017 (UTC)

Translation request[edit]

Hi, I am wondering if a translation could be made. I am planning to update descriptions and the desired phrase is "Village in China". Thanks in advance. MechQuester (talk) 13:23, 1 July 2017 (UTC)

Lachman test (Q580886) cleanup[edit]

There has been a mixup in Lachman test (Q580886). I have cleaned it up and moved some information to cruciate ligament injury (Q34623048), but I haven't moved the Japanese language link, - as I do not read the langauge. Please read the language link on Lachman test (Q580886) and move it if it is about cruciate ligament injury (Q34623048). — Finn Årup Nielsen (fnielsen) (talk) 13:07, 3 August 2017 (UTC)

I've moved the sitelink to w:ja:靭帯損傷 into ligament injury (Q38039238) and changed the Japanese label of Lachman test (Q580886). --Okkn (talk) 14:55, 27 August 2017 (UTC)

Wikidata:Requests for comment/Defining account creators[edit]

I have started this RFC about account creators. --MediaWiki message delivery (talk) 22:00, 21 October 2017 (UTC) (for Rschen7754)

主観的な記述の投稿者[edit]

説明欄について、モバイルアプリから主観的な記述を連続して投稿している方がいます。このような場合はどうしたら良いでしょうか。 https://www.wikidata.org/wiki/Special:Contributions/Ajt1145141919 Higa4 (talk) 07:30, 4 November 2017 (UTC)

User talk:Ajt1145141919にて説明欄の使い方についてのお願いを記入しました。何度か警告しても改善がないようであればWikidata:Administrators' noticeboardにて投稿ブロックを依頼することになるかと思います。--本日晴天 (talk) 01:13, 5 November 2017 (UTC)
早速対応ありがとうございます。当方で既に1,2件修正してしまってはいるのですが、以後しばらく様子見したいと思います。Higa4 (talk) 12:07, 6 November 2017 (UTC)
投稿内容に改善が見られないため、Wikidata:Administrators' noticeboardにて投稿ブロックを依頼した結果、当該利用者に対して無期限の投稿ブロックならびに会話ページの編集禁止・ウィキメールの送信禁止の措置がとられました。--本日晴天 (talk) 08:55, 15 November 2017 (UTC)
対応ありがとうございました。--Higa4 (talk) 07:52, 18 November 2017 (UTC)

P1814の使い方[edit]

Property talk:P1814#How do you give a reading in kana to items?にて、name in kana (P1814)の使い方についての議論が行われていますので、こちらでお知らせいたします。P1814の値における平仮名・片仮名の使い分けと、P1814を使用する条件の2つが論点になっています。一人でも多くの方が参加してくださればと思います。--本日晴天 (talk) 05:18, 30 December 2017 (UTC)

REQ: Remove featured article badge from Q1931001[edit]

Doraemon: Nobita's Little Star Wars (Q1931001)w:ja:ドラえもん のび太の宇宙小戦争)になぜか秀逸な記事フラグが立っているので、フラグ削除をお願いできますでしょうか?JAWPでの秀逸な記事の選考手続きも特に見当たらず、何らかの手違い(Special:Diff/298077416)でフラグが付けられているものと思います。--やなぎ0 (talk) 13:26, 29 January 2018 (UTC)

✓ Done ご報告ありがとうございます。当該リンクのバッジを除去しました。--本日晴天 (talk) 01:19, 30 January 2018 (UTC)
お手数をおかけしました。ありがとうございます。同類の誤りがgood articleにもあったので昨晩中に合わせてお願いしようと思ったのですが、こちらは不要なのにバッジがついている、必要なのにバッジがついてないの2パターンあって洗い切れなかったので後日改めてお願いさせて頂きます。ご認識されていると思うのですが、バッジの付け外しはadmin権限のないアカウントでは不可と怒られてしまうので、お手数をおかけすることご容赦下さい。両バッジを合わせて依頼できなかったこと(二度手間をお願いすること)は申し訳ありません。--やなぎ0 (talk) 08:26, 30 January 2018 (UTC)
残件についてもPetScan等で調査を行い、バッジの付与・除去を行いました。バッジを除去したのはRyan Toby (Q719799)pseudobulbar affect (Q3508789)2013 AFF Women's Championship (Q4629028)Murder of Tadao Takashima's son (Q11669642)Peiris Award (Q166177)の5項目、バッジを付与したのはextruded polystyrene foam (Q46998058)Bolgar Historical and Archaeological Complex (Q47519282)(ウィキデータ項目を新たに作成しました)の2項目です。これによりw:ja:Category:秀逸な記事w:ja:Category:良質な記事w:ja:Category:秀逸な一覧との整合性は完全にとれているはずです。ちなみにバッジの追加・除去を行うにあたっては管理者である必要はなく、承認された利用者自動承認された利用者であれば可能です。--本日晴天 (talk) 11:20, 30 January 2018 (UTC)
素早い対応、ありがとうございます。私の方で洗っていたものとも大体一致しているので安心しました。承認についても情報提供ありがとうございます。それを使わないといけない時がきたら、改めて申請させて頂きます。--やなぎ0 (talk) 14:59, 30 January 2018 (UTC)

merge request[edit]

Q11533594 (架橋ポリエチレン絶縁ビニルシースケーブル, crosslinked polyethylene insulated PVC sheathed cable) is same topic to Q2666962 (Cross-linked polyethylene). Please merge Q11533594 to Q2666962 .--すじにくシチュー (talk) 23:28, 12 February 2018 (UTC)

Cross-linked polyethylene (Q2666962)は素材であり、no label (Q11533594)はそれを使ったケーブル(製品)ですのでマージすべきではないと思いますが、どうでしょうか。--Camillu87 (talk) 00:05, 13 February 2018 (UTC)

There is "Power Cross Insulation" section at "Other uses" on English "Cross-linked polyethylene" page. So,I don't feel there is a need to separate the insulated cable page from "Cross-linked polyethylene" page.

英語の"Cross-linked polyethylene"のページに、"Other uses"として"Power cable insulation"(電力の絶縁ケーブル)というセクションもある。なので、わざわざ絶縁ケーブルのページを独立させる必要が無いと、私は思います。--すじにくシチュー (talk) 00:25, 13 February 2018 (UTC)

WikipediaとWikidataでは、まとめる単位が全くちがっています。またwikipediaの場合、含まれるものだったら統合ということもありますが、wikidataではwikipediaに比べ同じものも非常に細かく項目が分けられています。データとして扱う場合には特性が違うものは違う項目として扱います。なお、wikipediaの記事「w:ja:架橋ポリエチレン絶縁ビニルシースケーブル」がノートで提案されてるように「架橋ポリエチレン」にページ名変更対応がされた場合にはマージということもありだと思います。--Camillu87 (talk) 01:32, 13 February 2018 (UTC)

For the time being, I changed the name of Wikipedia "架橋ポリエチレン絶縁ビニルシースケーブル" to "架橋ポリエチレン". There may be a possibility that someone will be reverted later, so I think I will see a state for a while.

とりあえずWikipediaのほうを「架橋ポリエチレン」にページ名変更しておきました。もしかしたら、あとで差し戻し等される可能性もあるので、しばらく様子を見ようかと思います。--すじにくシチュー (talk) 03:51, 13 February 2018 (UTC)

Wikidata:Requests for comment/Privacy and Living People[edit]

There has been a request for comment about developing a policy about privacy and items about living people. Your participation is encouraged above. --MediaWiki message delivery (talk) 20:48, 24 February 2018 (UTC) (from Rschen7754)


recent deaths (Q20160207)[edit]

Japanese Wikipedia seems to be one of the larger ones that doesn't have such a report yet.

If you are interested in setting one up, I can help.

Essentially there are two different modes: one limited to people with article at a Wikipedia and one that has the full list of Wikidata (Wikidata:Database reports/Recent deaths).
--- Jura 10:00, 6 March 2018 (UTC)

FYI, @Jura1: I only find :w:ja:Template:亡くなったばかりの人物 that editors add to articles. --Omotecho (talk) 21:08, 15 March 2018 (UTC)

It still needed to be created. I now made one at ja:Wikipedia:ウィキデータ/recent deaths. If you want to keep it, please translate its title and check its column labels and move it to a title in Japanese.
I just noticed that ListeriaBot wasn't active in jawiki before. Its edits are caught by this edit filter.
--- Jura 04:30, 16 March 2018 (UTC)
@Omotecho, MartinPoulter, Magnus Manske: status of Listeria-bot for Japanese is at https://tools.wmflabs.org/listeria/botstatus.php#jawiki but it doesn't show that edits in userspace are caught by an abuse filter.
--- Jura 04:35, 16 March 2018 (UTC)
@Jura1: translated. Labels looks fine to me.
Could someone check labels, and if OK, move it to appropriate page in ja please? FYI, for ja title idea, I used the phrase 「この1ヶ月に亡くなった人々の一覧」to explain therein; wished to match its title in en “list of people who died in the last month”. --Omotecho (talk) 07:57, 16 March 2018 (UTC)

Wikidata:Requests for comment/Privacy and Living People[edit]

Additional proposals have been made on the RFC, and your comments are welcome. --MediaWiki message delivery (talk) 03:40, 9 April 2018 (UTC) (for [[User:Rschen7754|Rschen7754)

Template:Japan properties[edit]

FYI: {{Japan properties}}. Andy Mabbett (Pigsonthewing); Talk to Andy; Andy's edits 11:38, 10 April 2018 (UTC)

@Pigsonthewing: Thank you for creating the template! --Okkn (talk) 02:56, 11 April 2018 (UTC)

Lexicographical data関連の訳語[edit]

辞書学データ(Lexicographical data)の訳語を考えてみました(すでにあった訳もあります)。ご意見があればよろしくお願いします。-Afaz (talk) 06:42, 11 May 2018 (UTC)

英語 訳語 その他の候補
Lexeme 語彙素 レキシム
Lemma 見出し語 基本形、レンマ
Lexical category 語彙範疇 品詞、字句カテゴリ ※ 品詞⇔語彙範疇 入替え
Form 語形 形式
Representation 表現 表示
Grammatical Feature 文法的特徴
Sense 語義 意義
Gloss 注釈 注解、解説
word 単語
phrase 熟語
sentence 文章
prefix 接頭辞 接頭語
Afazさん、まとめてくださいましてありがとうございます。「Lexical category」は「品詞」で大丈夫でしょうかね。といいますのも、通常「品詞」に対応する英語は「part of speech」でありますし、また lexicographical dataには単語(word)だけでなく熟語(phrase)もありますが日本語では熟語に対しては「品詞」とは言わないからです。直訳で「語彙範疇」や「語彙カテゴリ」などとしておくのがいい気がします。
ところで日本語の単語に対する lexicographical data のモデル例ってすでにありますかね? 導入される前に予めディスカッションをしながらいくつか例を用意しておいた方が良いかもしれませんね。 --Okkn (talk) 10:03, 13 May 2018 (UTC)
そうですね。語彙範疇のほうがいいかもしれません。それとsentenceとsteatmentがどちらも「文」でかぶるなぁと思ったりしました。
モデル例は英語とドイツ語のはWikidata:Wiktionary/Data model examplesにありますね。…日本語のはないですね。
モデル例 動詞、日本語
  • (語彙素) L1
    • (見出し語) 行う行なうおこなう
    • (語彙範疇) 動詞
    • (言語) 日本語
  • (語形) L1-F1
    • (文法的特徴) 丁寧語
    • (表現) 行います行ないますおこないます
  • (語形) L1-F2
    • (文法的特徴) 受身
    • (表現) 行われる行なわれるおこなわれる
  • (語形) L1-F3
    • (文法的特徴) 使役
    • (表現) 行わせる行なわせるおこなわせる
  • (語形) L1-F4
    • (文法的特徴) 使役
    • (表現) 行わす行なわすおこなわす
  • (語義) L1-S1
    • (注釈) (ja) ある一定の様式やルールに従って、物事を実施すること
    • (注釈) (en) To perform; to do; to conduct oneself; to carry out.

動詞で考えてみました。「活用」をどう扱うかは分かりません。たぶん「語形」で扱うんでしょうけど。Steatmentで「活用の種類:五段活用」とかいうプロパティが必要かもしれません。--Afaz (talk) 18:47, 13 May 2018 (UTC)

ウィクショナリーでは、「活用の種類」と「語幹」の情報さえあれば、テンプレートで活用その他全部の語形を表示できるみたいですね(wiktionary:行う)。プロパティでその2つのデータだけ入力しておけば、ウィキデータ側でいちいち語形を全部入力する必要はないのかもしれません。--Afaz (talk) 20:31, 13 May 2018 (UTC)
早速のお仕事ありがとうございます。活用形は私も語形として扱うのがいいと思います。「(文法的特徴) 未然形」「(表現) 行わ」のような感じですかね。確かに語幹と活用のタイプさえ分かれば活用形を決定できますが、SPARQLなどで直接活用形を得たい人もいるかと思いますので、全部の活用形を語形として持っておけばよいのではないでしょうか。その場合はbotを使って活用形を展開したり、活用形が正しいかのチェックを定期的に行う必要がありますね。
「活用の種類/Japanse verb conjugation」のようなプロパティは早めに提案する必要がありそうですね。verb (Q24905)の下位クラスとして「五段動詞」や「上一段動詞」を用意してこれを「語彙範疇」に指定することも理論的には可能だと思いますが、それをしてしまうと扱いづらくなります。特に、例えば「五段動詞」が翻訳されていない言語では、その単語が動詞なのかどうか見ただけではわからなくなりますので。
「語幹」はどのように表現したらいいのでしょう。語幹を語形の一つとして格納するのは少し違和感があります。これも新しいプロパティが必要ですかね。
日本語版のWiktionaryでは、漢字交じりの Wiktionary:ja:行う と ひらがな表記の Wiktionary:ja:おこなう が別の項目になっています。送り仮名の揺れ(「行なう」)や、さらには歴史的仮名遣い(「おこなふ」)もありますね。一つのLexemeとして扱われるべきだとは思いますが、この複数の表記方法はどう扱っていくべきなんでしょうか。--Okkn (talk) 03:07, 14 May 2018 (UTC)
「語幹」はわたしもプロパティがいいと思います。テンプレートのパラメータですから。見出し語と表現はそれぞれ複数入力できて、つづりの違い(送り仮名の揺れ)や使用文字の違い(漢字・ひらがな・カタカナ)、言語の変遷を吸収するよう作られているみたいですが、歴史的仮名遣い・旧字なんかは、それが「古いもの」という情報が記録できないので、どうなんでしょうね。言語コードで区別するとか。中世日本語の言語コードとかあるんでしょうか。古英語にはあるみたいですが。この辺は開発が進むのを待つ感じでしょうか。--Afaz (talk) 05:04, 15 May 2018 (UTC)

日本語の辞書データ用のプロパティ提案 [edit]

上でのAfazさんとの議論をもとに、「活用の種類 (conjugation class)」と「語幹 (word stem)」についての新しいプロパティを propose しました:

みなさま、ぜひプロパティ作成のための議論にご参加ください!ほかにも何か日本語のデータに必要なプロパティがあればここでディスカッションしましょう。--Okkn (talk) 11:58, 16 May 2018 (UTC)

尊敬語・謙譲語 と 普通の語の間のリンクは新しいプロパティーが必要でしょうか?他の方法で表現可能でしょうか?プロパティを作るならsenseに対するプロパティーになるかと思います。--Okkn (talk) 05:17, 17 May 2018 (UTC)
wiktionary:行うにあるような「kanji in this term」の関係("行う"→"行")も新しいプロパティーが必要でしょうか。というか漢字の項目って導入するんでしょうか。その場合はlexical categoryはどうなるんでしょう。--Okkn (talk) 01:05, 18 May 2018 (UTC)
漢字の項目を作るとしたら、発音のところでon'yomi (Q718498)なのかkun'yomi (Q1147749)なのかを示す必要がありますね。また熟語の読みについてもon'yomi (Q718498)kun'yomi (Q1147749)jūbako-yomi (Q1717979)yutō-yomi (Q683484)を示す方法が必要ですね。--Okkn (talk) 01:14, 18 May 2018 (UTC)
同じ音読みでも呉音・漢音・唐音(宋音・唐宋音)・慣用音などがありますね(w:ja:音読み)。Wiktionaryの漢字の項目(wiktionary:en:行#Japanese, wiktionary:ja:行#日本語など)を見るとこの情報も載せてあります。これもプロパティが必要でしょうか。 --Okkn (talk) 01:26, 18 May 2018 (UTC)
日本語の漢字・熟語の読み方に関して、wiktionary:en:Template:ja-pronで示されるような発音のアクセントのパターン(頭高型・中高型・尾高型・平板型)の情報もWikidataで管理する価値がありそうです。 --Okkn (talk) 01:35, 18 May 2018 (UTC)
漢字の項目に対してはJōyō kanji (Q875368)なのか常用外漢字なのか、kyōiku kanji (Q17025353)なら何年生で習う漢字なのかの情報も有用でしょうね。漢字そのものだけでなく、漢字の読み方に対しても「常用漢字表内」「常用漢字表外」があるようです(wiktionary:ja:行#日本語など参照)が、どのようにモデル化にするのが良いでしょうね。 --Okkn (talk) 01:44, 18 May 2018 (UTC)
Pictogram voting comment.svg Comment ウィクショナリーのテンプレートのパラメータになっているものは、とりあえずプロパティとして必要なんじゃないかと思います。アクセント、読みの種類、漢字の習得難度、etc--Afaz (talk) 03:39, 18 May 2018 (UTC)
アクセントと読みの種類のプロパティを提案しました:
是非議論にご参加ください。
漢字の習得難度については、漢字の項目がどのようにモデル化されるのか不明なのでまだ作っていません。というのも果たして漢字はlexemeなのでしょうか(アルファベットの文字とかはlexeme扱いされるんですかね?)。また複数の読みが一つの漢字にありますが、一つの漢字は一つのlexemeとみなすのでしょうか。また、それぞれの読み方はどこに格納するのでしょうか(formでしょうか?そもそも読み方ごとに別のlexemeでしょうか?)。また、中国語の漢字と日本語の同じ漢字は同じ一つのlexemeなのでしょうか。それとも言語ごとに別のlexemeにするべきでしょうか。このあたりを先に詰めていく必要がありそうです。--Okkn (talk) 19:34, 18 May 2018 (UTC)
一部の漢字に対して既にQ itemが存在しているようです((Q3595028)など)。全ての漢字をQ itemにするならそれはそれでありだと思います。その場合漢字の意味(sense?)をどう扱うのがよいでしょうね。 --Okkn (talk) 06:27, 19 May 2018 (UTC)
国語辞典としてみれば漢字だけの項目は奇妙かもしれませんが、一応辞書には漢和辞典もありますので…。ひとつのlexemeにはひとつのlanguageしか設定できないので、中国語の漢字と日本語の漢字の2つができるようになると思います。つまり言語ごとに別のlexemeです。この辺はウィクショナリーと異なる点だと思います。読みごとにlexemeを分けるのはおかしいのでプロパティでなんとかできないでしょうか。--Afaz (talk) 21:02, 19 May 2018 (UTC)

Wiktionaryのテンプレートを参考にして、新たに漢字に対するプロパティのproposeを3つ行いました:

是非議論にご参加ください。 --Okkn (talk) 17:48, 19 May 2018 (UTC)

新たに導入が必要な日本語関連の言語コード[edit]

現在Wikidataのmonolingual textで使用できる言語で日本語関連のものは「日本語(ja)」しかありませんが、辞書のデータを保持する場合はテキストが漢字を含む表記なのか仮名表記なのかを明確に区別する必要が出てくるかと思います。例えば「中国語(zh)」では、使用する文字体系により「簡体中国語(zh-Hans)」と「繁体中国語(zh-Hant)」が分けられているように、日本語の文字コードでもISO 15924 codeを用いて「ひらがな表記の日本語 (ja-Hira)」「カタカナ表記の日本語(ja-Kana)」「ひらがな+カタカナ表記の日本語(ja-Hrkt)」「かな漢字交じりの日本語(ja-Jpan)」「ローマ字表記の日本語(ja-Latn)」などと使用する文字体系を明示的に指定できます[1][2]。最も標準的な表記に"ja"を指定すると思いますが、それ以外の表記については、

  1. 漢字しか含まなければ"ja-Hani"、ひらがなしか含まなければ"ja-Hira"、カタカナしか含まなければ"ja-Kana"、ひらがなカタカナ交じりならば"ja-Hrkt"、かな漢字交じりの表記ならば"ja-Jpan"、というように細かく使い分ける
  2. "ja-Hira"のみを導入して、ひらがな表記だけを用意し、それ以外は"ja"にする
  3. "ja-Hrkt"のみを導入して、ひらがなまたはカナカナを適切に使用した表記だけを用意し、それ以外は"ja"にする

というようないくつかの方法が考えられると思います。どういった方法を選択し、どの文字コードを使用しますかね。あとローマ字表記用の"ja-Latn"も当然必要になるのではないかと思います。

また古語の日本語に関しては、「ojp」というコードがあるようですが[3]、これの導入も必要でしょうか。辞書なので古文単語の項目にはひらがな表記用の「ojp-Hira」なども必要になるかと思います。

ちなみに新しくこれらの文字コードをWikidataで使用できるようにするためには、Wikimedia Phabricatorで依頼をする必要があります(Help:Monolingual_text_languages#Getting_a_language_code_added参照)。みなさまのご意見をお聞かせください。--Okkn (talk) 11:58, 16 May 2018 (UTC)

すでになんかphabricatorにも議論ができてるみたいです。--Afaz (talk) 02:35, 17 May 2018 (UTC)
このPhabricatorの議論は一般的なIETF言語タグでは表現できないような細かい分類の方言とかの場合ですかね。ひらがな表記とかローマ字表記とか古語日本語に関しては一般的に通用するIETF言語タグが存在しているので、今までどおりの新しい言語を導入する方法になるかと思います。 --Okkn (talk) 05:04, 17 May 2018 (UTC)
Pictogram voting comment.svg Comment ja-Hiraは日本語版ウィクショナリーで動詞を全部ひらがなにしているので、導入は必要ですね。それ以外についてはちょっとまだ分かりません。--Afaz (talk) 03:32, 18 May 2018 (UTC)
wiktionary:ja:オリオン座→"オリオンざ"のような読み仮名もありますので、ja-Hrktも必要かと思います。カタカナで表記する外来語にわざわざja-Kanaを使うかは難しい問題です。ただし、wiktionary:ja:ボタン→"釦"やwiktionary:ja:レモン→"檸檬"、wiktionary:ja:ぶらんこ→"ブランコ", "鞦韆"など、「標準的な表記ではないが漢字で表記されうる外来語」も存在しますので、ja-Kanaとja-Haniの区別も必要かもしれません。--Okkn (talk) 07:36, 18 May 2018 (UTC)
やるとしたら細かく使い分けたほうがいいかと思いますが、「文字種」の情報(ひらがなだけ、カタカナだけ、それ以外)はプログラミング的には正規表現使えば得られるので、どうだろうなぁと思っています。標準的に使用される表記を「ja」にして、それ以外に「ja-Hira」などのISO 15924コードを使うという運用をすれば「標準表記とそれ以外」という情報が得られるようになりますが、運用が複雑化しますし。(と思ったら、Wikidata:Property proposal/Japanese pitch accentでの使い方はまさにそういう方法ですね。)やるならシンプルなルールのほうがいいですね。古語の言語コード「ojp」はプログラミング的に得られない情報が含まれるので必要だと思っています。--Afaz (talk) 20:48, 19 May 2018 (UTC)

Lexical categoryに指定する日本語の品詞 [edit]

学校文法に従えば日本語の品詞は

があり、これらをLexical category(語彙範疇)に指定することになるかと思います。

ただ、少し気になるのがadjective (Q34698)は日本語の形容詞だけでなく英語などの形容詞にも使われますので、adjective (Q34698)に相当するものは日本語の文法における「形容詞」だけでなく、adjectival noun (Q1091269)adnominal adjective (Q11639843)なども含むと思われます(w:en:Japanese equivalents of adjectives)。日本語の文法における「形容詞」のみにadjective (Q34698)を指定するのが良いのか、形容動詞にもadjective (Q34698)を指定してその活用の種類として「i-adjective」や「na-adjective」を示すのが良いのか、あるいはadjective (Q34698)は使わずに、日本語の形容詞に相当するものを新たに作成してそちらを使うか、といった方法が考えられます。ちなみに英語版のWiktionaryでは、Wiktionary:Category:Japanese_adjectivesの下位カテゴリとしてWiktionary:Category:Japanese_い-i_adjectivesWiktionary:Category:Japanese_な-na_adjectivesがあります(なおWiktionary:Category:Japanese_adnominals(連体詞)は独立したカテゴリーになっています)。何かアイデア・ご意見などはありませんか。--Okkn (talk) 11:58, 16 May 2018 (UTC)

Pictogram voting comment.svg Comment 外国人向け日本語教育では形容動詞は「な形容詞」、形容詞を「い形容詞」と教えるらしいので、そうなっているんでしょうね。「形容詞 - adjective (Japanese)」を作成して、それを使うほうがいいような気がしますが、確信はもてません。過去の議論でも「Lexical categoryは言語に依存する」と言われていますし、「国文法での形容詞」が「欧米文法での形容詞」と異なるならウィキデータ的には分けたほうがいいかとは思いますが。世界共通の分類によるLexical categoryづけはこの議論でされていますが、出典として利用可能な日本語辞書がないためムリでしょうね。--Afaz (talk) 02:31, 17 May 2018 (UTC)
考えてみれば、英語ではbeautifulが形容詞、beautifullyが副詞なの対して、日本語では「美しい」も「美しく」も形容詞で、「綺麗だ」も「綺麗に」も形容動詞ですので、品詞を対応させる事自体厳しいんでしょうね。逆に、Japanese (Q5287)adjective (Q34698)の組み合わせが指すものは一意に定まるはずなので、割り切ってadjective (Q34698)を使うのでも良いかもしれません。
あまり詳しくないのですが、形容動詞の英語は "adjectival noun" とも言われるんですね。Wiktionaryや国語辞書では形容動詞の語幹部分だけを見出し語にしているので、確かに名詞のような扱いをしているのかもしれません。Wikidataでも語幹部分だけを見出し語にするんでしょうかね。 --Okkn (talk) 05:37, 17 May 2018 (UTC)

辞書学データの最初のリリース[edit]

とりあえずSpecial:NewLexemeで、助詞、助動詞、連体詞、接続詞を入力してみました。言語と語彙範疇が文字化けしますね。これはphab:T195359に報告されているようです。代名詞を入力しようとして、L676の見出し語に「私」、「わたし」、「わたくし」と入力しようとしてみましたが、同じ言語コードでは左端のものしか受け付けないようです。まだ大量のインポートはするなと言っていますし、本格的な入力はツールができてからになりそうですね。--Afaz (talk) 01:01, 24 May 2018 (UTC)

Lexeme:L676で「わたし@ja」だけが見出し語になっていたところに「私@ja」を追加しようとする編集をしたら、追加ではなく既存の見出し語の変更になりました。最終的にこのような挙動ではなくなると思いますが、同じ言語の複数の見出し語を認めない方針なのか(すでに登録されている言語の見出し語を追加しようとするとエラーになるような挙動になると思います)、単にプログラムのバグで複数の見出し語を受け入れられない仕様になっているのかどっちでしょうね。 --Okkn (talk) 11:28, 24 May 2018 (UTC)