User talk:Nono314

Jump to navigation Jump to search

About this board

Logo of Wikidata

Welcome to Wikidata, Nono314!

Wikidata is a free knowledge base that you can edit! It can be read and edited by humans and machines alike and you can go to any item page now and add to this ever-growing database!

Need some help getting started? Here are some pages you can familiarize yourself with:

  • Introduction – An introduction to the project.
  • Wikidata tours – Interactive tutorials to show you how Wikidata works.
  • Community portal – The portal for community members.
  • Contents – The main help page for editing and using the site.
  • Project chat – Discussions about the project.
  • Tools – A collection of user-developed JavaScript tools to allow for easier completion of some tasks.

If you have any questions, please ask me on my talk page. If you want to try out editing, you can use the sandbox to try. Once again, welcome, and I hope you quickly feel comfortable here, and become an active editor for Wikidata.

Best regards! Liuxinyu970226 (talk) 00:07, 20 May 2015 (UTC)

Previous discussion was archived at User talk:Nono314/Archive 1 on 2016-01-17.

Encore une bizarrerie de ListeriaBot

1
Edelseider (talkcontribs)

Bonjour Nono, alors, cette fois-ci c'est la suivante : quand on fait une mise à jour manuelle de Wikidata:WikiProject sum of all paintings/Location/France/Top creators by number of paintings, le bot usine pendant une minute puis il annonce "update status: OK" ; sauf que la mise à jour ne s'est pas faite. J'en sais quelque chose, puisque j'ai récemment créé plusieurs fiches consacrées à des tableaux du père Roll, si bien que celui-ci devrait gagner plusieurs rangs dans le classement (et Henner prendre encore un peu plus la tête, vive l'Alsace !) Je crois que ce problème du "OK qui n'est pas OK" n'est pas inédit, mais quelle est la solution ? Merci d'avance !

Reply to "Encore une bizarrerie de ListeriaBot"
Edelseider (talkcontribs)
Nono314 (talkcontribs)

Bizarre, oui.

Pas l'air d'y avoir eu de changement récent du côté de ListeriaBot, et la liste France a été correctement mise à jour peu avant. Je tablerais plutôt sur un problème temporaire de récupération du contenu des éléments..

Edelseider (talkcontribs)

À suivre, donc. Cordialement,

Edelseider (talkcontribs)
Nono314 (talkcontribs)

Pas terrible, oui. Enfin, il y a au moins les noms.

J'ai laissé un commentaire à Magnus, mais je ne sais pas s'il le verra.

Si ça touche surtout cette page, on peut essayer d'arranger la requête pour tout récupérer en sparql, mais j'ai un peu peur que ça s'étende (on a au moins un autre cas qui semble similaire).

Edelseider (talkcontribs)

De quel cas s'agit-il ?

Je ne crois pas que Magnus répondra à ton commentaire. Il a été souvent interpellé sur les problèmes récurrents de Flickr2Commons, un autre outil de sa création, mais n'a jamais réagi. Je pense qu'il considère tout cela comme de l'histoire ancienne, commne quelque chose de dépassé. J'espère que je me trompe.

Nono314 (talkcontribs)

Il a créé des dizaines et des dizaines d'outils et c'est impossible de tout maintenir en même temps. Pour ListeriaBot c'est un outil assez récent et il a fait des modifications substantielles pas plus tard qu'il y a 3 mois. Il faut juste arriver à capter son attention, ce qui n'est pas toujours évident. Dernièrement il était sur un nouveau jouet (Cersei) et il a été très réactif à mes commentaires. C'est sûr la nouveauté est toujours plus intéressante.

En attendant j'ai modifié la requête.

Nono314 (talkcontribs)

Et pour le cas c'est celui qui est mentionné dans le premier post du topic (les rues des Pays-Bas).

Edelseider (talkcontribs)

Merci.

Edelseider (talkcontribs)
Nono314 (talkcontribs)

La gangrène s'étend, comme on pouvait le craindre.

Edelseider (talkcontribs)

Faut-il donc amputer ?

Reply to "Très bizarre"

Détection de certains duplicatas par numéro d'inventaire et titre

3
Jcmoissinac (talkcontribs)

Bonjour

J'ai entrepris d'établir des requêtes de contrôle qualité pour limiter les problèmes que j'ai rencontré sur mes créations d'entités. Un premier exemples est cette méthode pour contribuer à détecter les duplicatas de façon anticipée

Cette première approche cherche les entités 'peinture' qui partagent titre et numéro d'inventaire

La requête WDQS

select distinct ?e1 ?e2 ?coll1 ?coll2

where {

  ?e1 wdt:P31 wd:Q3305213; wdt:P217 ?inv; wdt:P195 ?coll1; wdt:P1476 ?title .

  ?e2 wdt:P31 wd:Q3305213; wdt:P217 ?inv; wdt:P195 ?coll2; wdt:P1476 ?title .

  filter(?e1!=?e2)

}

limit 1000 offset 0

me montre qu'il y en a au moins 1000

En fixant ?coll1 à la valeur Musée des Beaux-Arts de Rennes, je n'en trouve aucun. Je suppose que mes erreurs ont été corrigées, peut-être par toi.

Après je ne sais pas faire des fusions quand cela est justifié

Nono314 (talkcontribs)

Bonsoir,

Oui, pour ce qui est des peintures, j'ai a priori effectué (quasi) toutes les fusions (j'ai pu en rater 1 ou 2).

Pour les autres types, il reste a priori de quoi faire. Je ne sais pas si chercher des doublons de numéro d'inventaire est l'approche la plus simple, surtout si les collections sont potentiellement différentes. Pour ma part, je suis parti sur les arks pour trouver ceux qui sont présents sur plusieurs éléments (de 2 à 7) et j'ai en ai trouvé 172 distincts.

Pour fusionner, la méthode est expliquée par ici.

Nono314 (talkcontribs)
Reply to "Détection de certains duplicatas par numéro d'inventaire et titre"

Au sujet de la mise à jour de Q115621575

5
Jcmoissinac (talkcontribs)

Merci pour cette mise à jour. Je serais intéressé par des compléments d'informations.

Pour 'described by URL', j'avais mis l'URL POP correspondant à l'œuvre, ce qui me paraissait être une référence correspondant bien aux donnée qui m'ont servi de base (données de la base Joconde converties en CIDOC-CRM dans le graphe de connaissances SemJoconde). La référence que tu as mise est assurément plus riche. Je regrette cependant que la référence POP ait disparue. Est-ce une règle de Wikidata de n'indiquer qu'une valeur pour 'described by URL'? Y a-t-il un moyen de récupérer pour d'autres œuvres une URL telle que celle que tu as fournies (une API ou autre)? j'ai généralement un titre et un créateur, éventuellement une date plus ou moins précise.

J'ai vu qu'en ajoutant json à l'url que tu as fournie, je peux récupérer une structure JSON. Je vais voir comment enrichir Wikidata et SemJoconde à partir de ce json.

Pour 'instance of', c'est très utile d'avoir 'print'; en effet, quand je n'est pas cette précision dans les données SemJoconde, je met 'creative work' comme valeur par défaut; je n'ai pas pour l'instant de méthode fiable pour être plus précis quand les données d'origine ne contiennent pas cette information (une idée serait, par exemple, si on a une image, de faire une analyse d'image pour deviner le type d'objet). Avec le json ci-dessus, je peux récupérer la dénomination estampe.

Pour le numéro d'inventaire, il semble que je ne l'ai pas dans SemJoconde; du coup, je vais pouvoir le récupérer dans le json et ton exemple me montre comment il faudrait le renseigner dans Wikidata.

En tâtonnant, j'ai pu trouver l'image suivante https://collections.mba.rennes.fr/flora_mba/ark:/10946/00327552/doc/816901/BEST.jpg que j'ai insérée dans Wikimedia Commons puis référencée dans Q115621575. Le json référence plutôt http://collections.mba.rennes.fr/flora_mba/ark:/10946/00327552/doc/816901 qui donne une redirection vers https://collections.mba.rennes.fr/flora_mba/ark:/10946/00327552/doc/816901. As-tu des recommandations concernant l'insertion des images dans Wikidata? (je pense qu'avec l'ajout de valeurs pour le champ 'depict', les images sont un vrai plus pour les œuvres).

Derrière ces questions, il y a l'idée d'insérer dans Wikidata de nombreuses œuvres à partir de SemJoconde, en commençant par petites salves (ex: une dizaine à chaque fois), puis, une fois des précautions mises en place, faire une insertion assez massive. J'ai 8301 œuvres du Musée des Beaux-Arts de Rennes dans SemJoconde. J'ai trouvé seulement 171 entités de Wikidata situées au Musée des Beaux-Arts de Rennes.

Nono314 (talkcontribs)

Bonjour @Jcmoissinac

Il n'y a pas de règle définitive pour le nombre de valeurs de décrit à l'URL (P973), même si on se limite gébéralement à 2-3 valeurs pertinentes. En revanche, il est de règle de ne pas doublonner des liens déjà présent via un identifiant (ici identifiant Joconde d'une œuvre (P347)). L'identifiant offre en effet le même en apportant un aspect sémantique et limite l'obsolescence grâce au formateur.

Pour ce qui est du site du musée de Rennes, je suis loin d'être un expert, l'ayant découvert récemment. Je peux toutefois te signaler cette api qui permet de récupérer une liste d'œuvres dans un format json proche de celui que tu as observé sur les entrées individuelles. Malheureusement, il y manque des informations capitales comme les dimensions, espérons que les données seront complétées à l'avenir.

Je ne connaissais pas le projet SemJoconde que je découvre grâce à toi. Je suis un peu surpris par ta remarque sur nature de l’élément (P31) car le champ domaine (DOMN) de Joconde permet généralement une bonne identification du type d'oeuvre, sans se lancer dans une analyse d'image hasardeuse.

Sur Wikidata on travaille surtout sur les peintures. Je te suggère de regarder le projet Wikidata:WikiProject sum of all paintings auquel je contribue pour les peintres et musées français, et aussi plus généralement Wikidata:WikiProject_Visual_arts.

Je travaille moi-même pas mal à partir des données Joconde, je regarderai donc avec intérêt ce qui existe dans SemJoconde. Je vois que dans le repo git, il y a des extracts des catalogues M'n'M des différents thésauri Joconde. Avez-vous réussi à les exploiter ? Je me souviens avoir été très déçu par ces thésauri lors de leur publication, et par leur non-usage dans l'interface POP.

Mais là encore, je m'étonne que tu n'aies pas le champ inventaire qui est à mon sens un des plus aisément exploitables dans Joconde (je l'utilise massivement pour des pré-matchings avec les éléments Wikidata).

Je fais moi-même régulièrement des imports de taille plutôt moyennes (de plusieurs dizaines à quelques centaines d'éléments) car je pratique un workflow semi-manuel : je dispose dans une base d'entrées de nombreuses sources (Joconde, sites des musées, etc...) que je pré-traite avant de les consolider et de les enrichir par exemple avec les images disponibles sur Commons.

J'imagine qu'on aura l'occasion d'échanger sur nos expériences respectives :) Et je te recommande également @Shonagon si tu as des questions : il a beaucoup travaillé sur l'enrichissement des données sur Wikidata à partir de JocondeLab la version sémantique "historique" de Joconde.

Jcmoissinac (talkcontribs)

Bonjour @Nono314

Désolé pour l'histoire des duplicatas. Je pense que c'était lié à des cas où un même numéro d'inventaire apparaissait dans plusieurs entités. Je vais faire une revue approfondie de code pour éviter ça, quitte à ajouter beaucoup moins de contributions en filtrant intensivement les données dont je dispose.

Pour SemJoconde et mes autres contributions envisagées à Wikidata, c'est volontiers que j'échangerais directement avec toi. On pourrait faire une visio ou une rencontre si tu as l'occasion d'être sur Paris. Je suis joignable sur jcmoissinac at gmail.com.

J'ai eu plusieurs fois des contacts avec @Shonagon; dans le plus récent, il m'a recommandé de regarder Omeka-S pour faire des interfaces sur les données sur lesquelles je travaille. J'ai eu aussi des contacts avec Nicolas Vigneron (je ne connais pas son pseudo)

Nono314 (talkcontribs)

Bonjour @Jcmoissinac,

Ce sont des choses qui peuvent arriver...

Idéalement, sur des imports d'un tel volume, il faudrait pouvoir surveiller de près, pour repérer les problèmes suffisamment tôt et pouvoir rectifier le tir. Dans le cas présent c'est arrivé malheureusement assez tard, et j'ai pensé au départ qu'on avait surtout des doublons avec des éléments existants, avant de découvrir les répétitions multiples au sein des éléments créés eux-mêmes.

Je viens d'ailleurs de découvrir un autre souci : les identifiants Joconde que tu as positionné sur les éléments sont souvent sans rapport. J'ai pu identifier les cas lorsqu'il y avait deux identifiants après fusion et retirer celui qui était en trop, mais il y a aussi des cas à un seul identifiant qu'il va falloir repérer. A priori ce sont des entrées dans Joconde dont le numéro d'inventaire contient celui de l'œuvre de Rennes, mais qui appartiennent souvent à d'autres collections en fait (par exemple ici, tu avais associé le Joconde du 2006.4.17 du musée Flaubert de Rouen au 2006.4.1 de Rennes). Encore un point à revoir, j'en suis désolé.

Jcmoissinac (talkcontribs)

Bonjour @Nono314

Je vais lancer un test systématique sur toutes mes créations concernant le Joconde ID

Reply to "Au sujet de la mise à jour de Q115621575"

Call for participation in a task-based online experiment

1
Kholoudsaa (talkcontribs)

Dear Nono314,

I hope you are doing well,

I am Kholoud, a researcher at King's College London, and I am working on a project as part of my PhD research, in which I have developed a personalised recommender model that suggests Wikidata items for the editors based on their past edits. I am collaborating on this project with Elena Simperl and Miaojing Shi.

I am inviting you to a task-based study that will ask you to provide your judgments about the relevance of the items suggested by our model based on your previous edits.

Participation is completely voluntary, and your cooperation will enable us to evaluate the accuracy of the recommender system in suggesting relevant items to you. We will analyse the results anonymised, and they will be published in a research venue.

The experiment should take no more than 15 minutes, and it will be held next week.

If you agree to participate in this study, please either contact me at kholoud.alghamdi@kcl.ac.uk or use this form https://docs.google.com/forms/d/e/1FAIpQLSfA1wfdBfCRlcG3WhDyc-V8lzgPNx3fDFCNXkyn4CSwahXZ_A/viewform?usp=sf_link

Then, I will contact you with the link to start the study.

For more information about my project, please read this post: https://www.wikidata.org/wiki/User:Kholoudsaa

In case you have further questions or require more information, don't hesitate to contact me through my mentioned email.

Thank you for considering taking part in this research.

Regards

Reply to "Call for participation in a task-based online experiment"

Toujours ce "killed by OS for overloading memory"

7
Edelseider (talkcontribs)
Nono314 (talkcontribs)

Bonjour Edelseider,

Ce que tu appelles "critères de recherche", sont essentiellement des paramètres d'affichage. Ils peuvent cependant avoir un impact sur l'empreinte mémoire de ListeriaBot, mais supprimer des identifiants ne sert à rien : s'il faut taper quelque part c'est au niveau des créateurs (oui, c'est dur !).

En fait, ListeriaBot a historiquement un défaut, il charge en mémoire tous les éléments nécessaires pour l'affichage. Si ceux des tableaux sont généralement plutôt légers, ceux des peintres sont plus conséquents et même parfois énormes à cause de HannolansBot qui se complaît à générer ce genre de plâtrée.

On ajoute à ça que la Wikimedia foundation a fait le choix de faire tourner la plupart des tâches au sein de conteneurs aux ressources extrêmement contraintes.

Bref j'ai fait une modif pour remplacer P170^par la description qui contient généralement la même info mais en texte pur et ça débloque la mise à jour, pas idéal mais efficace... Et quoi que tu en penses, ça a bien quelque chose à voir avec la mémoire !

Edelseider (talkcontribs)

Tu as trouvé l'astuce qui tue, mais ce n'est pas le même genre de meurtre que celui perpétré par OS ! Si je le tenais, ce salaud... Merci encore !

Nono314 (talkcontribs)

Par curiosité, quelle est la mise à jour que tu attendais avec temps d'impatience ? Je ne vois guère de différence à part qu'on a perdu les liens AGORHA sur les peintures italiennes, qui ont été supprimés par Thierry Caro en juillet, mais apparaissaient toujours "grâce" à la liste figée en juin.

Edelseider (talkcontribs)

J'ai créé plusieurs fiches, mais elles sont noyées dans la masse. Numéros d'inventaire MBA 346 à 349, 1959, 2083, 742...

Edelseider (talkcontribs)
Nono314 (talkcontribs)

Ah tiens, c'est vrai, sur la page Alsace, j'avais déjà retiré P170 en le remplaçant par un bricolage maison pour générer les liens. Liste plus longue = limite atteinte plus tôt. Et cette fois j'ai été plus expéditif dans la solution :)

Reply to "Toujours ce "killed by OS for overloading memory""
Multichill (talkcontribs)
Nono314 (talkcontribs)

Yes, they indeed are that's why, when processing Musée du Louvre, I checked every suggestion and left a few entries unmatched for lack of an exact match. I think I also checked Balat and RKD but I found them to be pretty much already in place (RKD have been matched for a long time and I think you worked on Balat mid-july). I did however add Balat on the couple items I created like Vierge allaitant l'Enfant (Q121268783).

For the record, I do not intend to work on a large scale on Friedländer, but I updated myself on your latest developments when coming back from vacations and thought I'd give a hand with French collections.

Multichill (talkcontribs)
Reply to "Working on Friedländer ID?"
Edelseider (talkcontribs)

Il s'agit peut-être d'une homonymie, mais la signature "H. Renard" en bas à gauche est clairement lisible: https://upload.wikimedia.org/wikipedia/commons/2/25/Henri_Renard-Plage_%C3%A0_Trouville.jpg

Il existe bien un peintre nommé Henri Renard, mais il est né en 1920. Ses tableaux sont très conventionnels, voire académiques, il est cependant impossible qu'il ait peint une vue de Trouville où les gens soient habillés à la mode des années 1870. Le peintre qui nous intéresse est un contemporain d'Eugène Boudin.

Il pourrait éventuellement s'agir du peintre Mary Renard (1849-1925), si le H est en réalité un M, mais la signature est différente : https://www.cotebasqueencheres.com/lots/137125-mary-renard-1849-1925

Nono314 (talkcontribs)

Le théologien étant né en 1894, ça fait un peu juste aussi pour peindre dans les années 1870, non ?

Le Bénézit connaît au moins deux peintres nommés Henri Renard, dont un actif dans les années 1860. Ils me semblent de meilleurs candidats que le doyen de la fac de théologie.

Edelseider (talkcontribs)
Nono314 (talkcontribs)

Oui, ça me semblait le plus probable.

Dans ce genre de cas, j'utilise souvent Mix'n'Match qui permet de chercher dans de nombreuses sources à la fois en comparant les infos biographiques, de voir si un élément existe déjà et, dans le cas contraire, de le créer en quelques clics comme dans cet exemple récent.

Reply to "Henry the Fox"

Académie française prize winners mix'n'match

1
Tagishsimon (talkcontribs)
Reply to "Académie française prize winners mix'n'match"

Extraction de l'identifiant AGORHA

2
Edelseider (talkcontribs)

Cher Nono314, j'ai une nouvelle fois besoin de ton aide. J'ai beau m'échiner, je n'arrive pas à extraire l'identifiant AGORHA (P2344) de la notice suivante : https://agorha.inha.fr/ark:/54721/6f402d84-d2ad-4946-bc50-5659f7beaeb4, qui concerne le tableau Q110371665. Les exemples qui sont donnés sur la page de discussion Property talk:P2344 ne me sont d'aucun secours, car je ne retrouve nulle part le chiffre "12544" dans la fiche de la Joconde et ne sais pas comment cet identifiant a été obtenu. Je suis sûr que tout cela est évident pour toi. Bien cordialement et merci d'avance,

Nono314 (talkcontribs)

J'ai renseigné l'identifiant pour ce tableau.

Le site Agorha a changé il y a un moment maintenant. Pour retrouver l'identifiant, il y a une indication sur la page de l'une des autres propriétés mais ça reste assez lourd.

De mon côté, j'avoue, je triche. J'avais récupéré le contenu de l'ancienne base, c'est donc plus simple d'avoir les identifiants, en tous cas pour ceux qui existaient déjà à l'époque.

Reply to "Extraction de l'identifiant AGORHA"