Topic on User talk:Bouzinac

Jump to navigation Jump to search
VIGNERON (talkcontribs)

Bravo pour cet import des voies de Monaco ! J'ai quelques remarques :

J'ai aussi quelques questions :

  • je suis aussi étonné par surprises d'utilisations d'OpenRefine,
    • pour "avenue" j'imagine que tu n'a pas sélectionner la bonne classe d'élément
    • par contre, je ne vois pas du tout d'où viennent les « réconciliations où il ne détecte pas l'élément déjà créé », pourrais-tu m'en dire plus ?
    • as-tu aussi un exemple de doublons (je l'ai vu parfois passé pour QS mais jamais pour OR)
    • pour l'absence du code FANTOIR, j'imagine que ce sont de nouvelles voies, non ?
Bouzinac (talkcontribs)

salut

  • capitales de début : OK mais je n'ai jamais compris ce besoin de minuscules initiales en fr...
  • P131 : à part mettre Monaco, je n'ai pas de fichier qui permette d'indiquer le quartier administratif...

Openrefine :

  • avenue : possible. Autre exemple : https://www.wikidata.org/w/index.php?title=Q98925236&oldid=1271872013 :(
  • c'est à dire que si tu réconcilie "avenue truc" (je n'ai plus l'exemple exact en tête), il ne trouve pas l' "avenue truc" déjà existante, et du coup, tu crées l' "avenue truc"
  • Doublons uniquement QS : j'imagine que si le QS a plusieurs fichiers avec des CREATE en parallèle de plusieurs utilisateurs, il fait le doublon en déconnant...
  • Absence de Fantoir... j'en doute car Monaco est construite depuis un certain temps déjà et bcp de rues quandmême sans Fantoir. J'ai même apparemment la rue allée Saint Jean-Paul II(Q98924937) qui a changé de nom... bref, Fantoir ne semble pas franchement à jour vis à vis de Monaco.

Aurais tu de ton côté moyen d'enrichir avec la coordonnée GPS ? @+

VIGNERON (talkcontribs)

Merci !

Pour le libellé (et la description aussi d'ailleurs), ce sont simplement les règles habituelles du français, on écrit bien « La rue truc est une voie de machin » et pas « La Rue truc est une Voie de machin ». Mettre une capitalisation correct permet de faciliter la réutilisation.

Pour le P131, dommage. Du coup, j'hésite : vaut-il mieux mettre juste Monaco (déjà présent dans pays) ou rien du tout. J'aurais plutôt tendance à choisir la première solution mais je te laisse voir.

Pour OpenRefine :

  • oui, clairement c'est un problème de classe de réconciliation mal choisie (ou bien pas du tout choisie ?), cela arrive parfois
  • ça c'est très étrange par contre, si c'est le même nom il devrait pouvoir le trouver même dans le pire des cas il me semble... (et encore plus ici si tu réconcilies avec un pays petit comme Monaco)
  • oui, QS déconne parfois (pas que sur les créations), c'est la raison principale pour laquelle j'utilise maintenant presque uniquement OR pour créer des éléments
  • oui, FANTOIR est une ressource très riche mais imparfaite (et pas que pour Monaco), par « récent » cela peut parfois être un temps assez long (une rue de Rennes crée vers 2009 n'est entrée dans le FANTOIR qu'en 2019 :/ ). Cela reste une ressource à utiliser mais c'est pourquoi j'insiste régulièrement sur le besoin de croiser avec d'autres sources.

Pour les coordonnées GPS, à part le faire à la main, je n'ai pas d'idée.

Bouzinac (talkcontribs)

Je n'ai jamais vu ce besoin de capitalisation côté anglais. Voir par ex Baker Street(Q804402) :) En cas de réutilisation, pourquoi ne pas forcer la minusculisation avec une formule lcase(1er caractère)||reste de la phrase... Je fais parfois du QS car l'envoi de Openrefine vers Wikidata ne fonctionne pas : le compteur reste bloqué à 0%, je n'ai jamais bien compris pourquoi mais je soupconne que plus le schéma OR est complexe, plus il bugge à l'envoi vers WD.

VIGNERON (talkcontribs)

L'anglais fonctionne très différemment du français. Non, forcer la « minusculisation » est une très mauvaise idée, pense à une phrase comme « l'état de l'État est dû à l'église de l'Église » ou bien « je mange un opéra(1858875) à Opéra(1392037) », la présence d'une minuscule a un sens qu'il est impossible d'automatiser d'où le besoin.

Pour OR qui semble rester bloqué à 0 %, cela m'arrive souvent mais en général, il suffit d'attendre (parfois 2 minutes, parfois jusqu'à 15 minutes, cela dépend du volume de données que l'on traite).

Bouzinac (talkcontribs)

Et c'est dans quel contexte de réutilisation ? Que dirais tu d'envoyer sur WD les rues Fantoir du département franco français 06 ?

VIGNERON (talkcontribs)

Euh, pour tout les contextes. Ce sont les règles générale d'écriture (du français en l'occurrence mais de nombreuses autres langues ont une fonctionnement similaire, je me rends compte que mon exemple marche aussi en anglais : « the state of the State is due to the church of the Church », pas pour les noms propres ceci dit).

Cela me gêne d'importer uniquement en se basant sur FANTOIR mais si tu croises avec d'autres sources de données, alors aucun problème.

Bouzinac (talkcontribs)

Par contexte, je voulais dire via quel traitement informatique/outil réutilisant le label fr wikidata ?

VIGNERON (talkcontribs)

Je maintiens : dans tout les contextes. Pour prendre exemple courante : les infoboxes (en général c'est invisible car les mots sont en première position et donc recapitaliser mais pas toujours, pas pour les qualificateurs notamment). De toute façon peu importe, il est nécessaire que les libellés soient corrects, y compris typographiquement (personne ne songerait à y introduire une faute d'orthographe mais étrangement une faute de typographie est considérée comme moins grave...).

Bouzinac (talkcontribs)

OK, dans une infobox. Tu aurais un exemple d'infobox où le titre de l'article doit être utilisé en phrase plutôt qu'en simple titre ?

Jura1 (talkcontribs)

S'il n'y a pas de numéro, je crois que la nom d'une rue prend une majuscule ..

VIGNERON (talkcontribs)

Non, justement après un numéro de voie on utilise une minuscule. C'est justement le cas des adresses dans les infoboxes, voir fr:Caserne du Bon Pasteur pour ne prendre qu'un exemple parmi des milliers.

PS: Jura1 étant intervenu dans cette discussion, je ne peux plus la poursuivre. Bon courage pour la suite.

Bouzinac (talkcontribs)

ok pour l'exemple/contexte de réutilisation du libellé, merci!