Topic on User talk:Ayack

Jump to navigation Jump to search
Nono314 (talkcontribs)

Bonjour Ayack,

Pour info, je viens de refaire une passe de scraping dur Clochers qui a donné un peu plus de 3000 nouvelles entrées dans le catalogue Mix'n'match.

J'ai aussi identifié un certain nombre d'entrées pour lesquelles l'identifiant a changé depuis l'année dernière (liste disponible ici)

Ayack (talkcontribs)

Merci @Nono314, il me semblait bien que les chiffres avaient changé. Je vais mettre à jour les identifiants (sauf si tu as prévu de le faire).

Nono314 (talkcontribs)

Je n'ai rien prévu à ce sujet, tu peux y aller !

Ayack (talkcontribs)

Hello @Nono314, j'ai enfin fait les corrections. J'ai malheureusement du supprimer les anciens identifiants, Quickstatements ne gérant pas les rangs.


Au passage, aurais-tu encore le fichier brut du scraping, sans la concaténation nom de l'édifice + commune ? Si oui, pourrais-tu me le communiquer s'il te plaît ? Une fois fini le matching des éléments existants, je prévois en effet de refaire un batch de création. Merci par avance.

Nono314 (talkcontribs)

Salut Ayack,

Pour ce qui est du scraping, le résultat est directement stocké dans une base de données, pas de fichier. Le contenu de la table des édifices est dispo ici. Il faut ensuite faire la jointure avec les communes. Une requête SPARQL devrait pouvoir te ramener directement les items à mettre en located in the administrative territorial entity (P131).

Par ailleurs, j'ai intégré les ajouts effectués à l'automne sur le site et ils sont maintenant dans Mix'n'Match aussi. Je continuerai à suivre les évolutions en début d'année pour essayer d'être aussi complet que possible. (ils ont un visiblement un lag assez important avec des ajouts en retard depuis 2017).


Ayack (talkcontribs)

Merci @Nono314, je vais regarder cela. Super que continue à mettre a jour Mix’n’Match !

Reply to "Clochers"