User talk:Harmonia Amanda

Jump to navigation Jump to search

About this board

Previous discussion was archived at User talk:Harmonia Amanda/Archive 1 on 2015-08-10.

Structured Data on Commons Newsletter - Fall 2018 edition

1
MediaWiki message delivery (talkcontribs)

Welcome to the newsletter for Structured Data on Wikimedia Commons! You can update your subscription to the newsletter. Do inform others who you think will want to be involved in the project!

Community updates
Things to do / input and feedback requests

Current:

Since the last newsletter:

Presentations / Press / Events
Partners and allies
  • The info portal on Structured Commons now includes a section on GLAM (Galleries, Libraries, Archives and Museums).
  • We are currently planning the first GLAM pilot projects that will use structured data on Wikimedia Commons. One project has already started: the Swedish Heritage Board researches and develops a prototype tool to provide improved metadata (translations, data additions...) from Wikimedia Commons back to the source institution. Read the project brief.
  • The documentation for batch uploads of files to Wikimedia Commons will be improved in 2019, as part of preparing for Structured Data on Wikimedia Commons. To prepare, the GLAM team at the Wikimedia Foundation wants to understand better which types of documentation you already use, and how you like to learn new GLAM-Wiki skills and knowledge. Fill in a short survey to provide input!
Stay up to date!

-- Keegan (WMF) (talk)

Message sent by MediaWiki message delivery - 17:58, 7 December 2018 (UTC)

Reply to "Structured Data on Commons Newsletter - Fall 2018 edition"
Sammyday (talkcontribs)

Bonjour Harmonia Amanda.

Je voulais fusionner les éléments Q621577 et Q21450880, mais tu as introduit Property:P1889 pour éviter qu'on les confonde, en précisant qu'il s'agit d'un cas où "les noms de famille et les pages d'homonymie doivent être associés à des éléments différents". Or je ne comprends pas pourquoi ces éléments ne devraient pas être confondus, puisque dans les faits, chacun des articles concerne une page de patronymie, autant en français, en allemand, bas-allemand ou en anglais. La seule différence semble être pour l'article en minnan, mais celui-ci ne contient quasiment rien. Peut-être que la différence ne se situe réellement qu'au niveau de la présentation des éléments et qu'elle ne correspond pas à ce qui est réellement contenu dans les articles. Peux-tu m'éclairer ?

Harmonia Amanda (talkcontribs)

Ce n'est pas à Wikidata de décider du sujet des articles, mais aux Wikipédias. Les Wikipédias en français, allemand et bas-allemand ont décidé qu'il s'agissait de pages d'homonymie, et pour certaines contiennent d'ailleurs des homonymies qui ne sont pas des homonymies de nom de famille. Les Wikipédias en anglais et en minnan (qui était du mauvais côté), concernent le nom de famille.

Or un nom de famille et une page d'homonymie ce n'est ontologiquement pas du tout la même chose ; à l'état-civil, j'ai un nom de famille, pas une page d'homonymie. Pour la propreté des données, pour la réutilisation de celles-ci, il y aura toujours deux éléments séparés. Quant à savoir de quel côté on rattache les articles, c'est un choix qui est fait sur les Wikipédias, et que Wikidata se contente de respecter et non d'imposer.

Nous ne pouvons pas fusionner les milliers de cas de ce type, puisque les Wikipédias qui ont choisi de créer des pages de noms de famille créent régulièrement des pages d'homonymies associées. Qu'elles n'existent pas aujourd'hui ne signifie pas qu'elles n'existeront pas la semaine prochaine ou le mois prochain, obligeant alors à une scission. Que les articles soient pour le moment quasiment vides n'est également pas un critère : les pages d'homonymies ont vocation à se développer en ajoutant d'autres homonymies (par exemple de toponymes), alors que les pages de noms de famille ont vocation à se développer en parlant du nom de famille (étymologie, histoire, répartition, etc.). Nous ne pouvons pas supposer que les articles resteront éternellement des ébauches !

Il serait complètement irrespectueux de notre part de considérer que les Wikipédias ne savent pas ce qu'elles veulent, qu'elles se sont trompées de catégories, de modèles, d'introduction, juste parce que de notre point de vue extérieur, c'est absurde. Je serais personnellement complètement pour que la Wikipédia en français fasse de véritables articles sur les noms, distincts des pages d'homonymie, mais ce n'est certes pas une décision que je peux imposer depuis Wikidata.

Sammyday (talkcontribs)

Je passe sur la page en minnan qui ne contient rien.

Mais effectivement, ce n'est pas à Wikidata de décider ce qui est le sujet de l'article. La page en anglais est une page d'homonymie - "This page lists people with the surname Appleyard"- comme la page en français - "Cette page d’homonymie répertorie des personnes portant le même patronyme".

La seule différence est que la page francophone mentionne qu'il y a patronymie et que la page anglophone se contente de lister toutes les personnes portant le même patronyme. Aucune de ces pages n'est une ébauche. Elles renferment donc le même sujet en terme de contenu, elles ont le même titre et la même destination. Il n'y a donc aucune confusion possible. Il n'y a pas d'introduction différente, pas de problème de modèle, ni de catégorie. C'est du contenu brut de l'article dont il est question.

Et si l'on peut craindre une chose, c'est que l'un de ces articles voit son contenu effacé pour être remplacé par un sujet différent (comme un article sur un nom de famille... ce que pour le moment aucun d'entre eux ne fait). Mais c'est le cas pour n'importe quel article... Si tu pense qu'un modèle d'homonymie transforme le contenu d'un article en autre chose que ce qu'il est, c'est à rebours de ce que tu souhaites ci-dessus.

Sammyday (talkcontribs)

Note qu'en fait, tu me donnes la réponse à ma question : il suffit que je modifie la présentation de l'item concernant l'article anglophone, puisque c'est actuellement une page de patronymie. Et je fusionnerais ensuite les deux.

Harmonia Amanda (talkcontribs)

Non, aucune fusion à effectuer, un nom de famille restant complètement différent d'une page d'homonymie, avec des utilisations différentes des données. Les gens n'ont jamais de page d'homonymie comme nom de famille !

Par contre, il peut y avoir déplacement des interwikis s'ils cessent de parler du sujet auquel ils étaient reliés précédemment. Ça ne rend pas les deux sujets identiques.

Je préfère prévenir qu'il y a eu discussion avant d'adopter ce système sur la Wikipédia en anglais et que donc potentiellement ils risquent de ne pas apprécier ce changement brutal de système surtout si tu décides de changer leurs milliers de pages de noms de famille en pages d'homonymie. À ta place, j'en discuterais avec eux au préalable.

Sammyday (talkcontribs)

C'est totalement conforme à l'usage de leurs modèles, qui prévoit toujours le cas où une page d'homonymie ne contiendrait qu'une liste de personnes partageant le même nom de famille (il suffit de regarder :en:Category:Human name disambiguation pages : All names in this category are human names, but they may also include fictional characters. For pages listing people with the same surname, but different given names, use {{surname}} instead). Donc les pages sur les noms peuvent aussi servir de page d'homonymie, il n'y a pas vraiment de contradiction de ce point de vue.

Je crois qu'en fait cette page anglophone fait les deux, et qu'une séparation des deux sujets (article sur le nom et page d'homonymie) est tout à fait possible, ou la création d'une page d'homonymie supplémentaire.

Harmonia Amanda (talkcontribs)

Comme je le disais, je veux juste que les données soient propres, et si une Wikipédia décide de changer son angle d'approche, alors déplacer les interwikis est logique. C'est une discussion à avoir là-bas et Wikidata se pliera à la conclusion décidée là-bas. Du point de vue Wikidatien, on fait des éléments par sujet, on y ajoute les données appropriées et on héberge les interwikis sur l'élément le plus approprié. Si les sujets des articles Wikipédia changent, on bouge les liens, vu que décider de quoi un article parle est un choix à faire sur Wikipédia pas ici.

Par contre, je réitère qu'on ne fusionne pas deux sujets différents sur Wikidata. Edit : mais que comme rien n'oblige un élément Wikidata à contenir des interwikis, l'interdiction de fusionner des sujets différents n'a pas d'incidence sur le fait que l'on veuille que tous les articles ayant des sujets vaguement liés soient sur le même élément.

Il me semble que la Wikipédia en anglais, de même que la Wikipédia en français et que Wikidata a un projet concernant les noms, cette discussion y serait probablement plus à sa place.

Harmonia Amanda (talkcontribs)

La Wikipédia en anglais a eu une discussion et supprimé toutes les catégories et modèles d'homonymie des pages de noms de famille il y a maintenant deux ou trois ans. Il n'y a plus aucun marqueur d'homonymie nulle part dans ces pages, même si le contenu, actuellement, n'a pas varié. On peut difficilement dire qu'ils ont fait cette refonte entière du système par pur hasard. Si tu estimes qu'ils ont eu tort, c'est sur la Wikipédia en anglais que tu devrais avoir cette discussion.

Au contraire, la Wikipédia en français utilise catégories et modèles d'homonymie. Je doute que ce soit par hasard également.

Personnellement, la seule chose que je veux, c'est que les données soient exploitables, et que donc on ne se retrouve jamais avec des gens ayant des homonymies à la place de noms, parce que ça, ça pourrit considérablement la réutilisation des données. Pour savoir où raccrocher les articles, on suit toujours modèles et catégories parce que ça indique de façon sémantisée la volonté des auteurs de l'article (on n'utilise pas une catégorie d'homonymie quand on ne veut pas qu'il s'agisse d'une homonymie). Après, il peut arriver qu'une Wikipédia refonde de fond en comble sa façon de gérer tout un pan de connaissances, la Wikipédia en anglais l'a fait sur ce sujet précis.

Harmonia Amanda (talkcontribs)

Pour résumer : Wikidata crée des éléments par sujet ; une page d'homonymie et un nom atant deux sujets différents, utilisés différement, appelant des données différentes, il ne faut les fusionner sous aucun prétexte. En revanche, rien n'oblige un élément Wikidata à contenir des interwikis, et si ceux-ci changent de sujet, il est tout à fait possible de déplacer les liens.

Reply to "Appleyard"
JSaltzer (talkcontribs)

Hi Harmonia,

I'm hoping you can help with a name correction.

Background:  The voice actor Lionel Wilson is frequently confused with the film actor Lionel G. Wilson.  Until recently the voice actor's en:Wikipedia page was labeled with the name of the film actor.  There is an archived discussion at https://en.wikipedia.org/wiki/Talk:Lionel_Wilson_(voice_actor) that ended with a decision to rename the voice actor's page to correct the error.  That rename happened two weeks ago.   (The film actor does not currently have his own Wikipedia page.)

There was also a Wikidata page named "Lionel G. Wilson" (Q3244140) containing statements describing only the voice actor, so at the same time I changed the English label to "Lionel Wilson".  That change also had the effect of renaming the Wikidata page name.  

But back in April 2018 you ran nameGuzzler on that page. Since at that time the page was incorrectly labeled with the film actor's name it was updated into 67 language labels.

The question is how to most efficiently change those 67 language labels to contain the voice actor's name.  Would this work?:

1.  Undo the nameGuzzler update of 10:58, 9 April 2018

2.  Run nameGuzzler again, but this time with the name "Lionel Wilson"

Depending on how things interact, that may leave a small number of language entries that were installed by others that still need to be corrected by hand, but that seems easier than changing all 67 languages by hand.

Harmonia Amanda (talkcontribs)

I trusted you and cleaned up the labels, and added some properties about his name to clarify the issue. Still, you should take this discussion on the Swedish and Simple Wikipedia, who still have "G." in their titles.

Reply to "Lionel Wilson (Q3244140)"
Summary by Harmonia Amanda

corrected

Migrant (talkcontribs)

Hello Harmonia Amanda. This edit of yours doesn't look right. could you please correct it please ? and maybe look up others if there were several of the same, since it is a batch of edits. See edit comments "#quickstatements; #temporary_batch_1539640509474". Best regards Migrant.

Harmonia Amanda (talkcontribs)

Thank you for spotting it!

Edit: I corrected the batch (my last of yesterday, when I was getting too tired it seems, and I made a SPARQL query to verify similar mistakes had not been made in the previous batches. All is clear, and thank you!

Wolfram Language entities for surnames

1
Mahir256 (talkcontribs)
Reply to "Wolfram Language entities for surnames"

Matching one id to multiple items with OpenRefine

8
Pintoch (talkcontribs)

Hi!

I have stumbled upon https://twitter.com/Harmonia_Amanda/status/1037207702060113920

In short, yes you can do that with OpenRefine. I haven't seen your dataset but intuitively this should be doable simply by doing the reconciliation in two columns, so that each id can be matched to one or two items. Just let me know if you need a hand!

Harmonia Amanda (talkcontribs)

Good to know! I'll try to configure it this evening. Do you have an example at hand? It would help me.

Pintoch (talkcontribs)

If you have not used OpenRefine yet you might want to start with generic tutorials for simple cases (I wrote some at Wikidata:Tools/OpenRefine/Editing).

For your own case, again I would need to see what your data looks like - otherwise I cannot give any precise indications. Is your dataset available anywhere, ideally in the form of a table or spreadsheet?

Harmonia Amanda (talkcontribs)
Hsarrazin (talkcontribs)

Hello @Harmonia Amanda - hope you had nice summer vacations :)

just tell me to get out if I'm wrong, but would those case not be a typical "Bonnie and Clyde" ?

Harmonia Amanda (talkcontribs)

If it were Wikipedia articles and we were obligated to create an entry for each ISU identifier, then yes. But we are not under obligations to follow the ISU way, and these IDs are widely used is the figure skating world for individuals. They are the key to find who participated to which competitions (and with whom). The ISU create a new entry each time something significant change for a skater. So people changing their sport country, passing from junior to senior, marrying and changing their names, etc., all of this warrant a new ISU IDs. So I'm not really that keen on following their modeling ^^

Hsarrazin (talkcontribs)

I see :D

good luck with your matching...^^

Pintoch (talkcontribs)

Great! Yes I think this should work. Happy to have a look at the spreadsheet.

Reply to "Matching one id to multiple items with OpenRefine"
Jura1 (talkcontribs)

Before undoing other users contributions, please open a discussion on the relevant project.

Harmonia Amanda (talkcontribs)

I let you a message just before yours.

Jura1 (talkcontribs)

My user page is n0t the relevant project .. please undo your changes and speedy deletions.

Harmonia Amanda (talkcontribs)

You didn't create a discussion before creating an item outside of the project scope (since we don't accept items in lieu of queries when queries would be the relevant way to deal with things), so no, I didn't think it necessitated a discussion there. You are welcome to start one and I'll participate.

Jura1 (talkcontribs)

Ok. I will undo it your place then.

Harmonia Amanda (talkcontribs)

please justify before your need for this item. If there is a use I missed, wich was not obvious, I'll gladly undo it myself (and use this item on all relevant names, and not just half ot it). Right now, it seems very obviously out of scope. I may be wrong about that but i would like an explanation please.

Jura1 (talkcontribs)

There is no requirement to discuss items before creating them.

Please restore Q56228301. If you think an item should be deleted, please use the relevant page.

I will open a discussion on WikiProject Names later this week.

Harmonia Amanda (talkcontribs)
Jura1 (talkcontribs)

If you want it to be discussed there, you need to restore it.

Harmonia Amanda (talkcontribs)

No, I agree, we don't usually discuss creation of new items. And when they are out of scope, they are speedy deleted. And sometimes that is contested and then it's discussed.

I honestly thought you created this item because you didn't know how to write the relevant query, so in my mind, writing the query solved yours needs and suppressed any need for the item.

It seems like you have a specific need you have not yet stated clearly which necessitate an item instead of a query. I can't imagine what but I'll be glad to learn.

It seemed a very clear cut case of a test item created because someone didn't know SPARQL. I didn't think it was controversial. I have no problem discussing it now that you are saying it is.

Jura1 (talkcontribs)

So when are you going to undelete it?

Jura1 (talkcontribs)
Harmonia Amanda (talkcontribs)

I undeleted as soon as I had back Internet access and re-opened the request.

Jura1 (talkcontribs)

There is an open question for you in the discussion.

Reply to "Please discuss first"
Thierry Caro (talkcontribs)

Bonjour. Aurais-tu l'occasion de créer des propriétés qui attendent de l'être depuis quelques jours ? Je suis l'auteur de la proposition et je ne peux donc pas le faire moi-même. Il y a par exemple Wikidata:Property proposal/Academia URL, Wikidata:Property proposal/Index of Historic Collectors and Dealers of Cubism ID, Wikidata:Property proposal/National Medal of Arts ID, Wikidata:Property proposal/PAM ID, Wikidata:Property proposal/So Foot ID et Wikidata:Property proposal/TPA ID. Je n'entends pas que tu te tapes l'ensemble du remplissage à faire. J'ai juste besoin que tu appuies sur le bouton de création, à charge pour moi de compléter tout le reste dans les minutes qui suivent. Peux-tu voir ?

Harmonia Amanda (talkcontribs)

Je regarde ça.

Thierry Caro (talkcontribs)

Merci beaucoup. C'est excellent. (Je prends les deux autres quand tu auras le temps.)

Thierry Caro (talkcontribs)

Salut. Je reviens vers toi parce que Category:Properties ready for creation s'est à nouveau remplie. Je vais m'occuper de certaines propositions parmi celles que je n'ai pas avancées, mais il y a en revanche Wikidata:Property proposal/Angelicum ID, Wikidata:Property proposal/PUSC ID, Wikidata:Property proposal/Historic Hotels of America ID et Wikidata:Property proposal/Voetbalstats ID pour lesquelles je vais devoir compter sur des tiers pour une création, donc peut-être toi ! La dernière est à la demande d'un contributeur de Wikipédia. Peux-tu voir, éventuellement ?

Thierry Caro (talkcontribs)
Reply to "Propositions en attente"

Give your feedback about changes to Special:Block

1
MediaWiki message delivery (talkcontribs)

Hello,

You are receiving this message because you are a top user of Special:Block on this wiki. Thank you for the important work that you do. There is a discussion happening about plans to improve Special:Block with the ability to set new types of blocks. To get the best design and new functions added, it is essential that people who use the tool join the discussion and share their opinions about these changes.

Instead of a full site wide block, you would be able to set a Partial Block. A user could be blocked from a single page, multiple pages, one or more namespaces, from uploading files, etc. There are several different ways to add this feature to Special:Block. Right now Important decisions are being made about the design and function.

Please review the page on Meta and share your feedback on the discussion page. Or you can reach me by email Also, share this message with anyone else who might be interested in participating in the discussion.

I appreciate any time that you can give to assist with making improvements to this feature. Cheers, SPoore (WMF) (talk) , Trust and Safety Specialist, Community health initiative (talk) 01:59, 10 August 2018 (UTC)

  • Apologizes for posting in English.
Reply to "Give your feedback about changes to Special:Block"

Structured Data Newsletter - Research link fix

1
MediaWiki message delivery (talkcontribs)

Greetings,

The newsletter omitted two interwiki prefixes, breaking the links on non-meta wikis as you might see above. Here are the correct links:

  1. m:Research:Curation workflows on Wikimedia Commons—a project that seeks to understand the current workflows of Commons contributors who curate media (categorize it, delete it, link to it from other projects, etc.).
  2. m:Research:Technical needs of external re-users of Commons media—soliciting feedback from individuals and organizations that re-use Commons content outside of Wikimedia projects, in order to understand their current painpoints and unmet needs.

My apologies, I hope you find the corrected links helpful.

- Keegan (WMF) (talk) 21:21, 6 July 2018 (UTC)

Reply to "Structured Data Newsletter - Research link fix"