Topic on User talk:Simon Villeneuve

Jump to navigation Jump to search
Summary by Simon Villeneuve

soutient pour OpenRefine

VIGNERON (talkcontribs)

Salut,

Si tu as besoin d'aide ou de conseil sur OpenRefine, n'hésite pas à demander (et je notifie au passage @Ludo29: que cela pourrait intéresser aussi).

Comme point de départ, il y a cette vidéo d'Emma : https://www.youtube.com/watch?v=wfS1qTKFQoI (en anglais mais je trouve que cela montre bien l'ensemble des possibilités d'OpenRefine)

Simon Villeneuve (talkcontribs)

coucou,

Merci pour l'offre. Je viens d'installer la version 3.3 et ça marche très bien.

Il y a cependant quelque chose qui m'irrite : lorsque je sélectionne "choisir une nouvelle correspondance" et que je fais mon choix, l'application me ramène au début du fichier. Ainsi, si, par exemple, j'ai 300 entrées, puisque je ne peux afficher qu'au maximum 50 entrées à la fois, je dois cliquer sur "page suivante" trois fois pour retourner aux entrées 150 à 200 et sélectionner une autre correspondance. Lorsque je choisis une autre correspondance, il faut que je recommence encore.

Y a-t-il moyen que lorsque l'on sélectionne une correspondance, on nous laisse sur la page en cours ?

VIGNERON (talkcontribs)

Mhhh, je n'ai pas ce problème (je ne suis pas sûr de comprendre ta manipulation mais je ne regarde pas vraiment les lignes suivantes, j'utilise plutôt les filtres par facettes dans ce genre de cas).

Pour ce genre de question technique, tu peux aussi t'adresser à @Pintoch: (qui travaille sur OpenRefine et en plus il est francophone ).

Pintoch (talkcontribs)

Salut Simon,

Oui c'est un problème bien connu, et on aimerait bien le résoudre. La solution la plus simple est d'utiliser une facette sur l'état de la réconiciliation (Reconcile -> Facets -> By judgment) et de sélectionner "none" (entité par réconciliée). Quand tu valides des candidats, ils sortent des critères de sélection et donc ça rend le problème moins gênant.

Simon Villeneuve (talkcontribs)

C'est super, merci !

Je constate souvent que pour les valeurs qui ne se réconcilient pas automatiquement, lorsque je cliques sur "search a match", le premier choix est le bon.

Y a-t-il moyen de faire en sorte que le premier choix soit attribué automatiquement aux valeurs non-réconciliées automatiquement ? Ou de chercher un mot/expression clés dans la description des choix ? Ainsi, par exemple, je sais que les valeurs non-réconciliées s'associent à des circonscriptions électorales fédérales canadiennes. Je chercherais ainsi, pour toutes les valeurs non-réconciliées, l'expression "federal district" dans la description en anglais de l'élément Wikidata et la valeur pourrait être automatiquement réconciliée avec tous les éléments qui possèdent le même label que la valeur et "federal district" dans la description.

Pintoch (talkcontribs)

Tu peux isoler des lignes avec des facettes, et ensuite utiliser l'action "Match cells to their best candidate" (dans le menu Reconcile -> Actions).

Les descriptions ne sont pas utilisées pour la réconciliation elle-même, elles sont juste affichées dans les prévisualisations, donc le procédé que tu décris ne serait pas très naturel dans OpenRefine. Par contre, ce que tu peux faire, c'est d'inclure l'information "federal district" pendant la réconciliation elle-même:

  • Crée une nouvelle colonne contenant "federal district"
  • Dans l'écran de configuration de la réconciliation, active cette colonne et lie-la à la "propriété" wikidata "Den" (Description, English).
  • Une fois ta réconciliation terminée, tu devrais constater que les items qui ont federal district dans la description ont un meilleur score que les autres. Isole-les avec la facette numérique sur le score, et éventuellement aussi une facette sur la distance d'édition entre valeur initiale et valeur réconciliée.
  • Utilise "Match cells to their best candidate" pour ces cellules.
Simon Villeneuve (talkcontribs)

Merci ! Je comprends mieux les notions de facettes et réconciliation. J'ai pas fait de colonne supplémentaire, mais j'ai réussi à améliorer les choses en passant par un autre chemin.
Une autre question pour toi : j'aimerais retirer d'un projet OpenRefine les entrées de la requête suivante. Est-ce possible et, si oui, comment ?

#Éléments liés à la 40e législature du Canada
SELECT DISTINCT ?item ?itemLabel WHERE {
  ?item p:P39 ?s1 .
  ?s1 ps:P39 wd:Q15964890 .
  ?s1 pq:P2937 wd:Q2816734 .
  SERVICE wikibase:label { bd:serviceParam wikibase:language 'en' }
}

Try it!

Pintoch (talkcontribs)
Simon Villeneuve (talkcontribs)

Malheureusement, je comprends pas trop la fonction cross. J'ai cependant trouvé une autre manière de faire.
Merci encore !