User talk:Gzen92/Archive3

From Wikidata
Jump to navigation Jump to search

Objets monuments historiques[edit]

Bonjour,

Sur St Mark's Chapel, Kervalet (Q2956905), ce n'est pas la chapelle qui est classée, ce sont trois objets à l'intérieur. Si tu veux indiquer leurs heritage designation (P1435) et Palissy ID (P481), je pense qu'il faut créer un nouvel éléments séparé pour chacun des objets. Sur https://tools.wmflabs.org/mix-n-match/?mode=sync&catalog=339 je vois qu'il y a aussi un problème avec les orgues dont différentes parties sont classées séparément, à mon avis ça justifierait d'avoir un élément pour l'orgue dans son ensemble plus un autre par partie classée, mais il faudrait sans doute décider ça sur une page plus publique. --Zolo (talk) 11:34, 12 January 2017 (UTC)[reply]

@Zolo: Bonjour, je suis d'accord avec toi, pour ce cas je vais séparer les objets de l'édifice. Après, même pour les MH c'est souvent une partie qui est inscrite/classée, il faudrait aussi faire des sous-éléments, mais il faut reprendre chaque notice un par une, ça représente un boulot colossal. Pour le moment, l'approximation prime, hélas. Gzen92 [discuter] 13:06, 12 January 2017 (UTC)[reply]
Oui, on pourrait faire des éléments pour chaque partie classée d'un bâtiment. Mais avec les objets c'est bien plus simple à faire : pour l'essentiel, les données ne sont pas encore sur Wikidata. Peut-être que le plus simple est d'y aller carrément et de créer les éléments correspondant aux 150 000 notices Palissy. Vu ton travail autour de Mérimée, ça t'intéresserait de participer ? --Zolo (talk) 13:28, 12 January 2017 (UTC)[reply]
On va continuer sur la page de discussion du projet. Gzen92 [discuter] 13:32, 12 January 2017 (UTC)[reply]
Bonjour,
Pour les orgues commme Pipe organ of Collégiale Sainte-Marthe, Tarascon (Q3356207), Palissy a souvent trois notices :
* Une sur l'orgue dans son intégralité ([1])
* Une sur le buffet ([2])
* Une sur la partie instrumentale ([3])
Je pense qu'il faut conserver cette distinction plutôt que de fusionner. D'une part, ça permet de garder un mapping propre, et d'autre part le buffet et la partie instrumentale sont souvent nettement distincts (créateur, matériau, date d'inscription, et même date de construction), donc c'est plus simple de les décrire séparément. --Zolo (talk) 07:44, 11 August 2017 (UTC)[reply]

Demande pour ton bot[edit]

Salut,

Me souvenant que tu avais un bot pour retirer l'espace des INSEE canton code (P2506), est-ce que tu pourrais retirer la première partie de Gertrude ID (P1529) et transformer - par exemple - MERIMEEIA35020139 en IA35020139 ? (en théorie l'identifiant pourrait commencer par PALISSY mais en pratique ce n'est le cas pour aucun identifiant entré dans Wikidata)

Cdlt, VIGNERON (talk) 08:52, 14 February 2017 (UTC)[reply]

@VIGNERON:, aucun problème, je te fais ça rapidement. Gzen92 [discuter] 13:36, 19 February 2017 (UTC)[reply]
Pasleim a déjà fait le boulot ;) Gzen92 [discuter] 13:50, 19 February 2017 (UTC)[reply]
Je viens de voir cela, thank you Pasleim! Cdlt, VIGNERON (talk) 14:56, 19 February 2017 (UTC)[reply]

Toile palissy[edit]

Bonjour je vois que ton bon a commencé les créations Palissy. Ca a l'air bien, mais je m'aperçois que "toile" est lié à textile (Q28823), ce qui n'est pas forcément top. Dans Q29167009, ça fait un peu bizarre. |Il semble que canvas (Q4259259) serait généralement adapté.Zolo (talk) 16:00, 5 April 2017 (UTC)[reply]

@Zolo:, comme textile (Q28823) est aussi utilisé par "textile", "tissu"..., j'ai remplacé textile (Q28823) par canvas (Q4259259) lorsque le libellé contenant le mot "tableau", puis quelques autres retouches manuelles via SPARQL. Cordialement, Gzen92 [discuter] 10:36, 6 April 2017 (UTC)[reply]

Your painting additions[edit]

Hi Gzen92, I'm happy to see you're adding paintings from France from the Palissy database! Some questions and remarks (in English because I'm afraid my French is not good enough):

  1. Why did you add the prefix "tableau : " in the label? Example at Q29161034. I assume because it's like that in the source data? Would you mind removing it?
  2. I don't understand what painting (Q20900710) is and how it's different from painting (Q3305213) (also asked at Topic:Tod3lz0f6htkgox3)
  3. Not all paintings seem to have location (P276), can you add this?
  4. creator (P170) seems to be available in the source data, but not added. Can you please add it?
  5. inception (P571) seems to be available in the source data, but not added. Can you please add it?
  6. Currently references are just stated in (P248), can you include reference URL (P854) retrieved (P813) in the reference too?

Did you add all Palissy paintings or are more coming up? Do they offer some sort of API or are you scraping the HTML? Keep up the good work and if you need any help, just let me know. Multichill (talk) 15:34, 9 April 2017 (UTC)[reply]

Hello and thank you for your remarks. We discussed what I should create here.
  1. "tableau :" it is in the source data, data.gouv.fr, column 8. This is not good, I will remove it ;
  2. for instance of (P31) : I used this page ;
  3. location (P276) : I only have information when places are in historical monuments Merimee (for example PM30000822 linked to PA00103250) ;
  4. creator (P170), column 10 of the data : too complicated to match with Wikidata elements ;
  5. inception (P571), column 11 : the information is not precise enough, I preferred not to put it ;
  6. reference URL (P854) / retrieved (P813) : I did not put it as it is not really a website but a downloadable database.
I will put your remarks on this page. Gzen92 [discuter] 17:00, 9 April 2017 (UTC)[reply]
Hi a few thoughts on the various fields:
creator (P170) can't we try something similar to Wikidata_talk:WikiProject_France/Monuments_historiques/tmp/nature ?
location (P276) same, to some extent (eg "église de l'Assomption ou église polonaise" -> Notre-Dame-de-l'Assomption (Q2379572). Could probably go much further using COM + EDIF: "Sélestat" + "église paroissiale Saint-Georges" -> St. George's Church, Sélestat (Q991867).
inception (P571) the downloadable file indicates quarters of centuries at best. The online database has more precise data. Hard to understand why they did that, but we definitely would need a date. Best would probably to scrape them directly from the online database, otherwise, I suppose we can go with the imprecise ones.
Dimension (height, width...) data are available in the online database, but not in the downloadable files.--Zolo (talk) 17:51, 9 April 2017 (UTC)[reply]
I already have a bot that takes names of creators and finds the right Wikidata item so I can cover that part. this list should keep the bot busy for a while! Multichill (talk) 19:58, 9 April 2017 (UTC)[reply]
Example edit. Multichill (talk) 20:43, 9 April 2017 (UTC)[reply]

Nappes d'autel[edit]

Thank you for your work with textiles in the Palissy database. I am going to look into English translations for the labels and descriptions of these.

The items with dénomination: nappe d'autel in the database would be better as instance of (P31) altar cloth (Q869547) instead of tablecloth (Q536168). Is that a change that your bot could make? - PKM (talk) 19:51, 1 August 2017 (UTC)[reply]

It's ok :
SELECT ?item ?label WHERE { ?item wdt:P31 wd:Q869547. }
Try it!
Gzen92 [discuter] 08:53, 5 August 2017 (UTC)[reply]
perfect, thank you. - PKM (talk) 19:17, 5 August 2017 (UTC)[reply]

Import de tout Mérimée[edit]

Salut,

Dans le cadre de WLM2017, on pense inclure tout les monuments de la base Mérimée. Du coup, on se demandait, serait-il possible d'importer tout Mérimée dans Wikidata ? (sachant que l'on peut se contenter d'une liste brute sur Commons pour faire fonctionner WLM mais il serait intéressant de profiter de Wikidata, surtout qu'un quart de Mérimée y est déjà).

Qu'en penses-tu ? (sachant que la semaine prochaine, je serais à Montréal pour Wikimania et je me plongerais plus dans les « détails » techniques mais je suis preneur de toute ton expertise et expérience sur le sujet).

Cdlt, VIGNERON (talk) 18:16, 4 August 2017 (UTC)[reply]

Hello @VIGNERON:. Tout importer pourquoi pas, mais j'ai déjà fait le maximum avec les données issue de data.gouv.fr. Si tu as d'autres données avec d'autres notices, je suis preneur, tiens-moi au courant. Gzen92 [discuter] 09:02, 5 August 2017 (UTC)[reply]
Oui, à ma connaissance, il n'y a rien de plus à reprendre sur data.gouv.fr, je pensais à directement moissonner le site de la base (il me semble que quelqu'un l'a déjà fait, Envlh serait-ce toi ?). Peut-être aussi qu'il y a aurait des choses à récupérer depuis Commons (mais sans doute plutôt pour comparaison a posteriori). Cdlt, VIGNERON (talk) 09:19, 5 August 2017 (UTC)[reply]
@VIGNERON: "aspirer" les pages web n'est sûrement pas la meilleure idée, le résultat serait trop aléatoire et certainement bugué. Il faudrait, à défaut d'avoir accès directement à la base de données, en demander un export au ministère de la Culture. Je vais tenter de les contacter, même si certains on déjà essayé... Gzen92 [discuter] 11:51, 5 August 2017 (UTC)[reply]
Merci, tiens moi au courant si tu as une réponse.
Sinon, pour le cas spécifique des monuments ayant deux fiches (une PA en tant que MH et une IA en tant que bien inventorié) et pour éviter d'avoir des fusions à faire par la suite, je me demandais si on ne pourrait pas moissonner le modèle Commons:Template:Mérimée sur Commons pour récupérer les cas ou plusieurs identifiants sont indiqués (à vérifier à la main évidemment mais cela peut faire une bonne suggestion). Saurais-tu moissonner Commons ? (malheureusement templatetiger n'a pas moissonné Commons, j'ai fait une demande, on verra bien...).
Cdlt, VIGNERON (talk) 12:06, 5 August 2017 (UTC)[reply]
Bonjour. J'avais fait un script PHP qui, à partir de l'url de recherche sur les bases Palissy et Mérimée, enregistre les résultats sous forme de fichier CSV. C'est bien un crawl des pages web : le HTML est moche mais permet de bien s'en sortir. Je ne pense pas que ça permettre de tout récupérer (ça se base sur les résultats d'une recherche et le script aspire chaque résultat un par un, ce qui peut être long). Je n'ai pas touché au script depuis deux ans, je peux vous l'envoyer. — Envlh (talk) 12:49, 5 August 2017 (UTC)[reply]
Envlh : c'est cool, si tu peux nous le fournir, nous le testerons avec plaisir. J'avais déjà tenté d'aspirer les pages, c'est facile de récupérer les notices car d'un format bien précis, pour d'autres champs c'est plus délicat, par exemple la commune car le code INSEE n'y figure pas...
VIGNERON : si on peux lister les catégories qui contiennent le modèle Mérimée (je n'ai pas trouvé comment faire) ça semble assez facile.
Gzen92 [discuter] 07:44, 6 August 2017 (UTC)[reply]
Moi et l'informatique, souvent cela fait 10 ;) mais Envlh on pourrait essayer regarder ça pendant Wikimania ;)
Gzen92 : je vois plusieurs façons d'obtenir la liste, le plus simple me semble d'utiliser Petscan : requête tout faite (par contre, pourquoi se limiter aux catégories ? les utilisations sur les fichiers ne peuvent-elle pas être aussi utiles ?).
Cdlt, VIGNERON (talk) 10:47, 6 August 2017 (UTC)[reply]

(en direct de Wikimania) pour info, j'en ai aussi discuté Léna pour lister les bâtiments avec de multiples id (par exemple : Commons:Category:Château d'Angers et File:Angers Castle R01.jpg). Le problème est un peu compliqué dans la mesure où un bâtiment peut avoir 2 *ou plus* identifiants (commençant par PA ou IA, genre 1 PA et 1 IA, 2 PA ou 3 IA, etc. les combinaisons sont nombreuses) et que pour les images, une photo peut représenter deux bâtiments distincts :/ Cdlt, VIGNERON (talk) 19:49, 9 August 2017 (UTC)[reply]

@VIGNERON:, effectivement avec les images ça pose problème si plusieurs bâtiments sont représentés. En se cantonnant aux catégories ça parait plus pertinent non ? Gzen92 [discuter] 09:14, 10 August 2017 (UTC)[reply]
Léna a commencé écrit un script (mais a rencontré quelques imprévus comme la présence de plusieurs modèles Mérimée sur une même page...). Je propose de faire les deux : les catégories et les images mais d'en faire deux listes séparés. Dans les deux cas, il vaut mieux vérifier à la main ; on peut commencer par le premier cas qui sera sans doute plus facile, plus rapide et plus fiable à traiter, dans le deuxième cas, sans doute plus compliqué mais toujours utile (surtout si l'on retire les premiers cas de la liste des seconds, je devrais pouvoir m'en débrouiller). Cdlt, VIGNERON (talk) 12:43, 10 August 2017 (UTC)[reply]
Le script recherchant les Mérimées en double (sur images et catégories, c'est quasiment la même chose) est en train de tourner, mais ça risque de prendre la journée (car analyse du texte d'une page). A partir de là on pourra faire les deux listes. Je pensais faire en sortie un tableau avec colonne 1 : image ou lien vers la catégorie ; colonne 2 le(s) PA, colonne 3 le(s) IA. Léna (talk) 14:01, 10 August 2017 (UTC)[reply]

Libellé de MH mobilier finissant par un point[edit]

Salut,

Entre quelques dizaines d'autres choses, je viens de tomber sur des éléments crée par ton bot sur des MHs mobiliers dont le libellé finit par un point :

SELECT ?item ?itemLabel WHERE {
  ?item wdt:P481 [] ; rdfs:label ?itemLabel .
  FILTER (lang(?itemLabel) = "fr"). 
  FILTER regex (?itemLabel, "\\.$").
}
Try it!

Est-ce volontaire ? Habituellement, je supprime ces points finaux mais le fait que ce soit des œuvres me donnent un léger doute.

Cdlt, VIGNERON (talk) 11:21, 12 September 2017 (UTC)[reply]

Salut @VIGNERON: hormis les quelques cas de "..." volontairement tronqués car libellé trop long (éventuellement à revoir), les autres sont les libellés exacts fournis dans le csv Palissy. Dès lors, je pense qu'on peut supprimer ces points finaux. Gzen92 [discuter] 15:31, 12 September 2017 (UTC)[reply]
Salut,
Je te propose de remplacer les ... par un …
Et de supprimer ensuite les points finaux.
Cdlt, VIGNERON (talk) 16:01, 12 September 2017 (UTC)[reply]
@VIGNERON: je suis totalement pour ! Gzen92 [discuter] 07:45, 13 September 2017 (UTC)[reply]
✓ Done j'ai traité à la main les quelques cas particuliers (il y avait aussi une abréviation « s. » que j'ai développé en « siècle ») et j'ai lancé Quick Statements pour traiter les autres (pour info, il n'y en avait que 110). Merci à toi. Cdlt, VIGNERON (talk) 08:17, 13 September 2017 (UTC)[reply]

Question SPARQL[edit]

Salut,

Déjà, en préliminaire, il y a un truc que je ne comprends pas sur La Rouquette (Q16508520), comment « aucune valeur » peut-il avoir une end time (P582) ? La qualificateur me semble inutile (et redondant avec le même sur instance of (P31)

Ensuite, ta requête est aussi bizarre (notament le filter) :

SELECT DISTINCT ?item ?itemLabel WHERE {
  ?item wdt:P374 [] .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "fr,fr". }
  FILTER ( ?item = wd:Q16508520)
}
LIMIT 10
Try it!

Je pense que tu cherches plutôt quelque chose comme :

SELECT DISTINCT ?item ?itemLabel WHERE {
  ?item wdt:P31 wd:Q484170 .
  MINUS { ?item wdt:P374 [] }.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}
Try it!

Cela donne toute les commune of France (Q484170) sans INSEE municipality code (P374). Après, si tu souhaites vraiment uniquement les anciennes communes, ce serait plutôt :

SELECT DISTINCT ?item ?itemLabel WHERE {
  ?item wdt:P31 wd:Q484170 .
  ?item p:P31 [ ps:P31 wd:Q484170 ; pq:P582 ?dateDebut ] . #avec une date de fin en qualificateur
  MINUS { ?item wdt:P374 [] }.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}
Try it!

Cdlt, VIGNERON (talk) 13:19, 13 September 2017 (UTC)[reply]

@VIGNERON: effectivement "aucune valeur" et end time (P582) ne devrait pas aller ensemble, seulement, pour le moment, mon algorithme se base sur INSEE municipality code (P374) pour récupérer les communes et si présence de end time (P582), c'est une ancienne commune.
Pour la requête que je t'aie présentée, le FILTER sert à montrer que la-dite requête ne me renvoie pas la La Rouquette (Q16508520) (j'ai isolé un cas qui pose problème).
Ta première requête est intéressante, elle ressort 1560 communes sans code INSEE et dont je passais à côté, ça, ça m'intéresse. Mais je ne préférais pas utiliser instance of (P31) car il faut prendre en compte dependent territory (Q161243), commune of France (Q484170), commune nouvelle (Q2989454), commune of France with specific status (Q22927616), municipal arrondissement (Q702842), district of the French Southern and Antarctic Lands (Q26807495) et on n'est pas à l'abri que d'autres apparaissent ce qui complique la chose.
Et la différence de tes deux requêtes, soit 581 communes, me pose un problème car elle sont forcément anciennes (j'ai a priori toutes les communes actuelles, en cohérence avec Wikipédia, à quelques cas près éventuellement) et il leur manque donc une date de fin.
En résumé, utiliser instance of (P31) me poserait pas mal de soucis, surtout que je n'ai plus le temps de retoucher mes algos pour Projet:Illustration des communes françaises, c'est pourquoi, quit à passer à côté d'anciennes communes, je préférais utiliser INSEE municipality code (P374).
Et ma question reste ouverte : comment obliger SPARQL à me retourner aussi les communes qui ont INSEE municipality code (P374) en aucune valeur...
Cordialement, Gzen92 [discuter] 13:45, 13 September 2017 (UTC)[reply]
Re-salut,
Ok pour le FILTER mais vu qu'il n'y a pas de INSEE municipality code (P374), tu filtres sur rien. C'est normal que cela ne renvoie aucun résultat.
Si tu ne veux pas passer par P31, ça va être plus compliqué. Un premier compromis est de prendre P31/P279* mais cela donne 1575 résultats soit seulement 15 de plus (donc soit les exceptions sont effectivement peu nombreuses, soit il y a un sous-type de communes mal classés).
Ensuite, oui, il y a pas mal de communes à problèmes qu'il faudrait corriger (la date de fin devrait être présente mais ne l'est pas, et parfois confusion complète et ce n'est pas une commune, comme Rimatara (Q1539984) que je viens de corriger).
Ah, je viens de comprendre (je comprends vite mais il faut m'expliquer longtemps , tu ne veux pas vraiment les « les anciennes communes qui n'ont pas de code INSEE » mais plutôt « les éléments qui ont une valeur vide pour code INSEE », c'est bien cela ? Si oui, la requête est plutôt :
SELECT DISTINCT ?item ?itemLabel ?typeLabel WHERE {
  ?item wdt:P31 ?type ; rdf:type wdno:P374 .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}
Try it!
Il n'y a que deux mais on trouve bien La Rouquette (Q16508520).
Ai-je répondu à ta question cette fois-ci ?
Cdlt, VIGNERON (talk) 14:16, 13 September 2017 (UTC)[reply]
@VIGNERON: à la base, ce qu'il me faut, c'est toutes les communes françaises (actuelles ou anciennes). J'avais bien bossé pour mettre des end time (P582) à INSEE municipality code (P374) (mais ok se serait mieux avec instance of (P31)) seulement, les communes avant 1943 environ n'ont pas de INSEE municipality code (P374) et ne ressortaient pas avec ma requête basique.
Et donc ta réponse me convient, puisque l'autre commune, Le Canet (Q16304790), fait parti des deux que j'ai moi-même modifié sur remarque de User:Père Igor, ça colle donc ! Avec ton aide, je devrais être en mesure de requêter correctement.
Merci, Gzen92 [discuter] 14:28, 13 September 2017 (UTC)[reply]


Salut,
Je n'y pense que maintenant, mais si tu t'intéresses au communes et à leur code INSEE, je me dis que cela pourrait être intéressant que tu utilises cet outil OSM+Wikidata Query (qui permet de requêter à la fois dans OpenStreetMap et dans Wikidata). Par exemple, cette requête ( tinyurl.com/ycvjcpue ) indique toutes les communes dont le code INSEE est différent dans OpenStreetMap et dans Wikidata (seulement 38 résultats, la plupart des erreurs côté OSM que j'irais corriger dès que j'aurais le temps).
Cdlt, VIGNERON (talk) 09:49, 20 September 2017 (UTC)[reply]

Erreur dans le RGC ou dans son import ?[edit]

Salut,

Je viens de tomber sur

⟨ L'Île-des-Pins (Q9718)  View with Reasonator View with SQID ⟩ area (P2046) View with SQID ⟨ 0 ⟩
stated in (P248) View with SQID ⟨ répertoire géographique des communes (Q20894925)  View with Reasonator View with SQID ⟩

. Du coup, je me demande, est-ce le RGC qui se trompe (du coup, il faut garder l'information et jouer sur les rangs) ou bien quelque chose a-t-il mal fonctionné durant l'import ?

Cdlt, VIGNERON (talk) 11:40, 7 November 2017 (UTC)[reply]

Salut @VIGNERON: il est bien indiqué 0 pour la superficie dans le fichier de données qui m'a servi à l'import. Après vérification, c'est le seul cas pour toutes les communes (ouf !). Cordialement, Gzen92 [discuter] 11:50, 7 November 2017 (UTC)[reply]
Ok, merci de la vérification. Oui, c'est bien la seule commune de France à 0 ;) Et du coup, j'ai mis l'autre valeur en rang privilégié (mais peut-être faudrait-il faire l'inverse et mettre le 0 en obsolète, ici j'ai un doute), donc cette déclaration ne devrait donc plus apparaître.
Si tu as le temps, est-ce que tu pourrais regarder dans les version plus anciennes et/ou plus récentes du RGC pour voir si c'est la même chose ?
Cdlt, VIGNERON (talk) 11:56, 7 November 2017 (UTC)[reply]
Hello @VIGNERON:, pour l'instant je ne pourrais pas te dire, je ne peux accéder au site de l'IGN... Gzen92 [discuter] 07:35, 9 November 2017 (UTC)[reply]
Maintenant que tu le dis, je crois vaguement me souvenir de quelque chose à propos du retrait en ligne du RGC, parce qu'il faisait inutilement doublon avec GEOFLA et ADMIN EXPRESS (ou quelque chose comme ça, en tout cas ces bases contiennent sans doute les informations que l'on cherche). Cdlt, VIGNERON (talk) 16:34, 9 November 2017 (UTC)[reply]

Pairs[edit]

Hi Gzen92, I noticed there are pairs of items at:

Can these be merged or is there some reason to have two?
--- Jura 22:28, 7 December 2017 (UTC)[reply]

@Jura1:, il faut toujours se méfier avec les phares (il n'est pas habituel que 2 ou 3 phares différents se situent sur le même site, parfois même avec le même nom) mais en l'occurrence je pense qu'il s'agit bien du même bâtiment et qu'il faudrait fusionner. Cdlt, VIGNERON (talk) 07:55, 8 December 2017 (UTC)[reply]
@Jura1, VIGNERON: j'ai vérifié avec les coordonnées et les vues satellites, pour moi il s'agit de doublons, je les ai fusionnés. Gzen92 [discuter] 08:43, 8 December 2017 (UTC)[reply]