Topic on Wikidata:Bistro/Archives des discussions structurées

Jump to navigation Jump to search

Doublon ? cebwiki a encore frappé...

33
Hsarrazin (talkcontribs)

Quelqu'un voit-il une différence entre Q49366053 et Q635428...

faut-il marquer Q49366053 comme doublon et demander la fusion des 2 (!) articles cebwiki ?

ou y a-t-il une subtilité que je ne vois pas (la géographie, c'est vraiment pas ma partie) ;)

Bouzinac (talkcontribs)

Tu peux modifier le code cebwiki pour redirect #REDIRECT Nom de la page de destination et ainsi fusionner les deux wikiitems. Cebwiki ... :rolleyes:

Hsarrazin (talkcontribs)

ma question ne porte pas sur le redirect... mais "est-ce bien un doublon ?" ;)

Cebwiki est effectivement un projet... :rolleyes:

Bouzinac (talkcontribs)

Oui c'est le même sujet…

Speltdecca (talkcontribs)
Hsarrazin (talkcontribs)

Merci @Speltdecca, s'il n'y en a plus que 6034, on est en progrès...

les doublons de cebwiki sont un vieux problème récurrent... et malheureusement trop connu... :lassitude:

je suis seulement tombé sur celui-ci en voulant utiliser l'élément de la commune pour lieu de naissance d'une personne ^^, mais ne déchiffrant pas le cebuano, et n'étant pas une bonne géographe, je voulais m'assurer du doublon avant de faire une bêtise ;) - entre autres, coordinate location (P625) est légèrement différent... et je ne m'y connais pas suffisamment pour mesurer si c'est significatif ou pas.

Speltdecca (talkcontribs)

Les coordonnées des gps ou des maps en ligne sont toujours différentes à quelques mètres près. Il n'y a à ma connaissance pas de consensus : Garmin Paris ≠ Tomtom Paris ≠ Google maps Paris ... donc ce n'est pas significatif.

Simon Villeneuve (talkcontribs)
VIGNERON (talkcontribs)

J'arrive un peu tard mais non, pour moi, ce n'est pas vraiment un doublon (et cela ne vient pas vraiment de cebwiki mais de Geonames, rendons à César...), il y a d'un côté la ville/village (entité urbaine) et de l'autre la commune (entité administrative).

La solution que je préconise est celle appliqué sur Les Fougerêts (Q35715423)/Les Fougerêts (Q70256). Vu que le sujet traîne depuis un certain temps, que pensez-vous de cette solution ? Puis-je la déployer en masse pour améliorer la situation ?

Hsarrazin (talkcontribs)

ah ! voilà !! merci :)

c'est précisément le genre de nuance que je capte parfaitement en français... mais qui est un chouia plus délicate en cebuano ;)

Si tu as les moyens de déployer en masse... vas-y ! pour moi, c'est tout bon :)

VIGNERON (talkcontribs)

Oui, sauf erreur, il me semble qu'il serait assez facile d'indiquer au moins que la localité est la capitale de la commune (en se basant sur le P31 et/ou le lien vers ceb.wp), et inversement. Je vais déjà regarder rapidement si il n'y a pas des cas particuliers (genre des éléments indiqués comme commune mais liée à un (lungsod) sur ceb).

VIGNERON
Mathieudu68
Ayack
Aga
Ash Crow
Tubezlob
PAC2
Thierry Caro
Pymouss
Pintoch
Alphos
Nomen ad hoc
GAllegre
Jean-Frédéric
Manu1400
Thibdx
Marianne Casamance
Le Passant
Notified participants of WikiProject France qu'en pensez-vous ?

VIGNERON (talkcontribs)

il y a au moins 12 élément commune-lungsod à corriger : w.wiki/45A

Bouzinac (talkcontribs)
Speltdecca (talkcontribs)
Commune-bourg-hameau

et même si il n'y a pas de hameau ou de lieu-dit ou autre espace urbain détaché du centre-bourg, cdt

VIGNERON (talkcontribs)

Parce que le village est bien la capitale de la commune (même si on parle généralement de "chef-lieu" mais c'est la même propriété), d'où vient ton flottement ?

Bouzinac (talkcontribs)

mon flottement vient que par exemple Paris a pour maire Hidalgo, alors qu'il y a 20 arrondissements. Sur ce principe, je m'étais dit que la "capitale", c'est le truc qui a le maire, donc le pouvoir… Pas forcément le centre mais le truc qui a le pouvoir Mais sinon pour les petites villes, oui, si j'étais admin (ce que je ne suis pas), j'irais zou les fusionner :)

VIGNERON (talkcontribs)

Euh, oui, tu as raison. Le chef-lieu est littéralement le lieu du chef (le maire en l'occurrence) et tout commune a un maire donc un chef-lieu (d'ailleurs tout territoire à une capitale, c'est juste plus surprenant pour les petits territoire).

Et oui, ce n'est pas forcément au centre (les exceptions sont rares mais il y en a, notamment des cas où la mairie se trouve même en dehors de la commune comme à Demi-Quartier (Q841329)).

Quant à fusionner, pas besoin d'être admin (par contre, il faut avoir un consensus et surtout beaucoup de temps devant soi, sur ceb.wp il y a déjà les milliers d'articles en "(munisipyo)" qui eux sont bien la même chose que la commune).

Speltdecca (talkcontribs)
Demi-Quartier (commune) Megève

bizarrement, il n'y a pas de Megève (lungsod), mais si ça aurait été le cas, elle aurait été deux fois capitale :

Speltdecca (talkcontribs)
VIGNERON (talkcontribs)

C'est étrangement formulé et surtout Paris est un cas vraiment à part (commune-département, loi PLM, etc.) donc plutôt non. Intuitivement, j'aurais plutôt dit que Paris unité urbaine (Q1082222) est le chef-lieu de Paris, il faudrait regarder ce que disent les sources.

Speltdecca (talkcontribs)
Bouzinac (talkcontribs)

Sauf que le 75004 n'a pas la prétention de diriger Paris entièrement… Je parle d'un centre politique, pas d'un centre géographique.

Speltdecca (talkcontribs)
Alphos (talkcontribs)

Mouais, c'est spécieux : je doute que beaucoup d'ouvrages de référence aient fait la distinction entre l'entité administrative d'une part, et le bourg, les hameaux et les terres environnantes séparément d'autre part.

Tout part du fait que cebwiki se base sur un identifiant de géolocalisation qui pointe quelques mètres à l'ouest (ou au nord, sincèrement c'est pas la question) de celui qui est déjà en place - peut-être qu'une bagnole s'était garée devant la plaque alors un géomètre avait décalé le marqueur un peu au hasard parce qu'il s'en était un peu foutu, au final, de l'exactitude de son relevé ? -, et considère que c'est donc une autre entité, pour des entités géographiques dont le "diamètre" dépasse le kilomètre. cebwiki a donc pété un jeton, et n'a rien compris à la notion de précision, ni à l'importance d'éviter les doublons. Fusionnez-moi tout ça, et qu'on en parle plus, une bonne fois pour toutes.

VIGNERON (talkcontribs)

Les deux concepts sont proches donc la fusion peut être une solution mais cela ne me semble pas la meilleure ni la moins simple (parce qu'il faut fusionner des dizaines de milliers d'articles sur des dizaines de Wikipédias).

Typiquement, en cas de fusion, il va falloir un sacré paquet de qualificatif pour distinguer la commune de la ville, typiquement la date de création qui est au plus tôt en 1789 pour la commune contrairement aux villes.

En plus, cela veut dire que l'on accepte sur Wikidata tout les lieux sauf ceux qui ont l'heur d'avoir le même nom que la commune ? (ce qui du coup, interdit de faire de faire des requêtes comme "liste des chefs-lieux qui ne sont pas homonyme de leur commune").

Enfin, même si on exclut Geonames (qui concerne des surfaces et pas des points d'ailleurs ; les coordonnées sont sensément identiques puisque légalement la coordonnée d'une commune est celle de son chef-lieu, y compris dans les rares cas ou celui-ci se trouve en dehors de la commune), on fait quoi des autres bases de données qui font la distinction (ce qui est rare) ou qui font spécifiquement et explicitement référence à la commune ou à l'agglomération (ce qui est assez courant) ? (par exemple, les bases d'inventaire comme Mérimée ou les équivalents régionaux) ou de la législation française qui fait aussi la distinction ?

Speltdecca (talkcontribs)

J'y suis favorable, mais est ce qu'on pourrait en plus, distinguer les noms du genre Les Fougerêts (entité urbaine) (Q35715423)/Les Fougerêts (entité administrative) (Q70256).

Bouzinac (talkcontribs)

entité administrative = ce serait la seule à recevoir l'identifiant code INSEE de la ville ?

VIGNERON (talkcontribs)

Une ville n'a pas de code INSEE, seule une commune en a un (d'ailleurs le "vrai" nom de ce que l'on appelle par raccourci code insee est bien code commune ) donc oui, seule la commune (qui est une entité administrative) devrait avoir la propriété INSEE municipality code (P374).

VIGNERON (talkcontribs)

Ok.

Et non, on ne met jamais de précision entre parenthèses dans les libellés (voir Help:Label/fr), il y a les descriptions pour faire la distinction.

Bouzinac (talkcontribs)

SAUF que c'est parfois gênant de pas avoir les parenthèses, exemple, quand je commence à saisir "french" le truc est capable de proposer la Q liée au nom de famille french et pas au "français" (exemple) même problématique dans OpenRefine... l'affichage de la description pêche régulièrement et on se plante facilement.

VIGNERON (talkcontribs)

Oui mais toujours non. Mettre des parenthèses causeraient immensément plus de problèmes que cela n'en résoudrait.

Pour la saisie, il y a les descriptions pour éviter les erreurs. Quant à OpenRefine, pour l'alignement on peut passer par les propriétés ce qui évite tout problème (en plus de rendre l'alignement plus rapide).

Simon Villeneuve (talkcontribs)

dans ce cas, l'étiquette avec parenthèses peut être ajoutée dans les alias.

Reply to "Doublon ? cebwiki a encore frappé..."