User:Liowalter/CIE7-2025-01
Voici les informations pour le cours CIE 7: Traitement de données et données liées donné 5 lundis de suite entre le 13 janvier et le 10 février 2025.
Raccourci vers cette page : https://w.wiki/Cdqo
Présentations
[edit]OpenRefine for Wikidata: the basics
OpenRefine pur Wikimedia Common : les bases
Participants
[edit]- Emiilyy2
- 000Intragna000
- J.preps
- Yogg Ronron
- Kresnex
- Dessk98
- Soyeon_is_the_Queen
- sandy.fntn
- C30333ta
- Gamila.wltr
- B Joanna
- Lagrut
- Thomas.czz
- Naerhym
- Miss Automne
- Dikibou
- Kreee2
- Lala1275
Plan du cours
[edit]Chaque jour de cours est découpé en 6 sessions d'environ 1h.
Jour 1 : Wikipedia et Wikidata
[edit]Session 1 : faire connaissance
- Présentations
- Déroulement du cours, structure, exercices, règles
Session 2 : Introduction au monde wiki
- wikipedia
- fondation wikimedia
- principes fondateurs, règles, édition
Session 3 : Wikidata (Introduction)
Session 4 : Données Liées (Linked Open Data)
- Structure base de données
- Structure url
- Relier des silos
- Identifiants préennes
Session 5 : les personnes dans Wikidata
- L'intérêt de la structure
- Les sources
- Les contraintes
Session 6 : la recherche
- Comment chercher
- Petite introduction à SPARQL
Jour 2 : Autorités et Wikimedia Commons
[edit]Session 1 : Autorités (Introduction)
Session 2 : IdRef
Session 3 : Autres autorités
Session 4 : Qu'est-ce qu'une donnée ouverte ? Licences Creative Commons et Copyright
Session 5 : Wikimedia Commons
Session 6 : Récapitulatif des jours 1 et 2, Développements récents, Challenges, Finalisation Exercices
Jour 3 : OpenRefine
[edit]Base de cette journée : https://librarycarpentry.github.io/lc-open-refine/
Session 1 : Présentation de OpenRefine, démarrage, import de données, affichage
Session 2 : Facettes, filtres, tris, clustering
Session 3 : Transformations et dédoublonnage
Session 4 : Exercices
Session 5 : Enrichir les données avec des informations qui viennent d'internet (ou d'autres fichiers)
Session 6 : Exercices
Jour 4 : OpenRefine (suite)
[edit]Session 1 : Réconciliation avec Wikidata et GND
Sesssion 2 : Pousser des données vers Wikidata, modèle de données
Session 3 : Comment récupérer des données d'internet, qu'est-ce qu'une API, qu'est-ce que le format JSON ?
Session 4 : Exercices
Sessions 5 et 6 : Charger des images sur Wikimedia Commons à l'aide d'OpenRefine
Jour 5 : Travail de groupe, présentations et récapitulation
[edit]Sessions 1, 2, 3, 4 : Travail de groupe
- Nettoyer des données avec OpenRefine
- Réconciliation avec Wikidata
- Pousser des nouvelles données sur Wikidata et Wikimedia Commons
- Enrichir Wikipedia
Sessions 5 et 6 :
- Présentations des travaux de groupes (5'-10' par groupe)
- Récapitulation de tout le cours, test de connaissances, ressources pour aller plus loin, évaluation du cours
Exercices
[edit]Jour 1
[edit]Session 2
[edit]- Transmettez à lionel.walter@arbim.ch votre nom d'utilisateur wiki
- Faites des tests d'édition wikipedia sur le bac à sable https://fr.wikipedia.org/wiki/Aide:Bac_%C3%A0_sable
- Faites votre première modification sur wikipedia (page de votre institution, de votre commune, de votre passion/idole, ...)
Session 3
[edit]- Trouvez votre institution (ou votre institution-mère) sur wikidata
- Manque-t-il des informations ? Ajoutez-les.
- Si votre institution ne s’y trouve pas, vous pouvez la créer, ou alors éditer une autre institution
- Faites de même pour votre commune de résidence / idole / ...
Session 4
[edit]Session 5
[edit]- Relier à Wikidata des personnes issues de vos catalogues, mettre le lien du catalogue et les numéros Q de wikidata dans un document
- Quelles informations pourraient être intéressantes à afficher dans votre catalogue comme contexte ? Exemple de l'ETH Zürich.
- Autres Exemples. Est-ce que la personne manque parfois ?
- https://swisscollections.ch/Record/991003319819705501
- https://swisscollections.ch/Record/991077097649705501
- https://swisscollections.ch/Record/991170524595005501
- https://memobase.ch/fr/object/bar-001-CJS_0525-6
- https://memobase.ch/fr/object/srf-012-A690B657-3184-4711-A4C4-F844AD6EBAF4_04
- http://data.performing-arts.ch/w/c3b44d65-08d8-4411-8900-570b5f73e1a7
- http://data.performing-arts.ch/w/fcfc0815-6e74-495c-b66e-ae325b77e0fb
Session 6
[edit]- Par groupes de 2
- https://query.wikidata.org/
- La liste des femmes ayant obtenu le prix Goncourt
- La liste des personnes enterrées au cimetière des rois à Genève, avec leur profession si elle est disponible
- La Galerie de portrait des conseillers fédéraux suisses
- Un graphique (barres verticales) des 10 villes suisses avec le plus d’habitants
- Liste d’écrivain.e.s suisses nés aujourd’hui
Jour 2
[edit]Session 3
[edit]Par groupes de 3 ou 4 :
- Groupe GND https://explore.gnd.network/
- Groupe VIAF https://viaf.org
- Groupe Geonames https://www.geonames.org/
- Groupe BNF https://data.bnf.fr/
- Groupe Library of Congress https://authorities.loc.gov/ ou https://id.loc.gov
Chaque groupe prépare une petite présentation (5-6 diapos avec démo de la plateforme) pour la classe qui répond aux questions suivantes :
- Quels sont les types d'autorités qui sont disponibles (personnes, sujets, ...) ?
- Qui alimente ces autorités, comment sont-elles gérées ?
- Y a-t-il un lien avec wikidata ?
- Pour 10 exemples de votre choix (si possible de différents types et de différentes "renommées"), comparez les résultats que vous obtenez avec les résultats de IdRef et de wikidata. Est-ce la même chose ? Complémentaire ? Plus précis ? Moins précis ?
- Quelle est la forme d'un identifiant unique ?
- Y a-t-il une hiérarchie ou bien des liens entre les autorités elles-mêmes ?
- Est-ce que les données sont disponibles en Linked Open Data ? Est-il possible de faire des recherches SPARQL ? D'exporter des informations ?
Session 5
[edit]- Ajoutez quelques photographies que vous avez prises de votre institution sur wikimedia commons. Si vous n'avez pas de photos avec vous, prenez quelques photos pertinentes et sous licence "Public Domain" ou "CC BY-SA" du portail https://ba.e-pics.ethz.ch/ et chargez-les sur wikimedia commons. Dans les deux cas, ajoutez des métadonnées aussi précises que possible
- Ajouter une image à un élément wikidata, par exemple votre institution.
- Ajoutez une image à l'article wikipedia de votre institution (ou institution mère). Cherchez sur wikimedia commons si des images pertinentes existent. Si vous n'avez pas d'image pertinente, ajoutez une image à un autre article pertinent (par exemple une des images de la collection Photoglob-Wehrli de la bibliothèque nationale)
- Répétez l'exercice pour votre commune de domicile, ou alors votre passion ou votre idole ou un article wikipedia de votre choix
- Ajoutez des métadonnées dans le cadre d'une campagne ISA Tool, par exemple Architecture à Genève ou Les images de la bibiothèque centrale de Lucerne
- Proposez une image à l'un des défis du mois : cuir ou ovale
- [Optionnel] Complétez votre page de profil sur wikipedia, pour que les autres utilisateurs puissent mieux vous connaître. Un exemple https://fr.wikipedia.org/wiki/Utilisatrice:LuciOle ou alors https://fr.wikipedia.org/wiki/Utilisateur:Liowalter. Ajoutez les langues que vous maîtrisez à l'aide de Babel (un code de type
{{#babel:fr|de-2|en-2}}à ajouter au code de votre page)
Session 6
[edit]- Complétez l'entité Wikidata de votre institution (ou créez-là si ce n'est pas encore fait). Vous pouvez utiliser https://www.wikidata.org/wiki/Q684773 comme modèle.
- Mettez les liens vers les notices d'autorité si celles-ci existent
- Approfondissez les exercices précédents. Publiez vos éditions sur wikipedia si ce n'est pas encore fait.
Jour 3
[edit]Session 3
[edit]Exercice 1 : Jeu de données 008
- Chargez le jeu de données 008
- Nous allons nous intéresser à la colonne document_local_field_1. Pour tous les documents qui ont à la fois le sous-champ $a rempli avec necfbvna et bpunfar2, modifiez la colonne document_sub_type et mettez partout la valeur docsubtype_pictorial_book
- Exportez maintenant les colonnes document_pid, document_title, document_sub_type et document_local_field_1 dans un fichier csv. Attention la colonne document_local_field_1 doit être identique à l'originale.
- Comparez votre résultat à la solution en utilisant le comparateur en ligne https://www.textcompare.org/csv/
Exercice 2 : Jeu de données 009
- Chargez le jeu de données 009 dans OpenRefine
- Supprimez les en-têtes de colonnes qui apparaissent plusieurs fois (probablement fait ainsi pour un inventaire imprimé)
- Nettoyez la colonne année, pour avoir uniquement des années au format numérique sur 4 chiffres (remplacez par la plus proche date possible ou rien si on ne sait pas)
- Supprimez les lignes vides
- Corrigez les valeurs étranges de la colonne Auteur (caractères spéciaux, retours à la ligne, etc...). Vous pouvez laisser les titres (Dr., Mgr, ...)
- Quand il y a plusieurs auteurs, séparez-les par le signe |
- Nettoyez la colonne Lieu. Il faut uniquement des lieux en français, sans parenthèses ou autres signes supperflus. Quand il y a plusieurs lieux, séparez-les par le signe |. La facette Lieu doit être propre.
- A titre d'exercice, nous allons supposer que quand un auteur n'est pas indiqué, il s'agit alors de l'auteur du document précédent. A l'aide de la documentation OpenRefine, trouvez la fonction qui permet de compléter les auteurs à chaque ligne.
- Exportez le résultat au format .csv
- Comparez votre résultat à la solution en utilisant le comparateur en ligne https://www.textcompare.org/csv/
Session 4
[edit]Référence : https://librarycarpentry.github.io/lc-open-refine/13-looking-up-data.html#looking-up-data-from-a-url
Par groupes de 2.
Exercice 1 : Jeu de données 005
- Chargez le jeu de données 005 sur l'univers dans OpenRefine
- Pour chaque ville mentionnée dans la colonne Lieu de Publication, récupérez les coordonnées (latitude, longitude) depuis geonames. A titre d'exemple : http://api.geonames.org/searchJSON?country=CH&type=json&style=FULL&maxRows=10&username=XXXXXXXXXXXX&name_equals=Geneve donne la latitude "46.20222" et la longitude "6.14569" de Genève qui se trouve en Suisse (country=CH)
- En vous basant sur l'ISBN, déterminez si les documents se trouvent dans Rero et dans le catalogue swisscovery des Hautes Ecoles pédagogiques. Informations détaillées ci-dessous.
Exercice 2 : Jeu de données 004
- Chargez le jeu de données 004 des publications de l'université de Neuchâtel
- Pour les 23 publications de 2011, en vous basant sur le titre et les auteurs, récupérez les doi manquants depuis crossref en suivant la documentation : https://api.crossref.org/works?query.title=room+at+the+bottom&query.author=richard+feynman (attention aux + qui remplacent les espaces). Comparez avec les doi existants dans le jeu de données pour voir si cela a fonctionné.
Exportez les deux fichiers obtenus au format csv et envoyez-les moi par email.
Jour 4
[edit]Session 1
[edit]Exercice 1 : Jeu de données 011 Châtelaine
- Chargez le jeu de données dans OpenRefine
- Reconciliez la colonne 1er responsable avec Wikidata
- Ajoutez le lieu de naissance dans le listing
Exercice 2 : Jeu de données 003 BGE - Compositeurs. La BGE a été approchée pour un futur événement musical qui voudrait mettre à l’honneur les femmes compositrices et particulièrement celles liées à Genève. La BGE a extrait, en se limitant aux notices bibliographiques de partitions, les auteur-rice-s en zone MARC 100 et 700, avec le sous-champ $a pour la première colonne, puis le champ $0 dans la seconde et la troisième, selon qu’il s’agisse d’un identifiant IdRef ou RERO, et enfin le compte du nombre d’occurrences de cet-te auteur-rice dans les notices. A partir de là, le but est d’identifier lesquelles pourraient avoir un lien avec Genève (ou avec la Suisse si c'est trop difficile). Comment procéder ? A titre d'exemple, Fernande Peyrot est une compositrice genevoise présente dans ce listing. On la trouve sur Wikidata et sur la GND.
- Pour aller plus vite, chaque étudiant peut prendre un petit lot correspondant à son numéro, cf. sous-répertoire lots
Exercice 3 : Jeu de données 012 CICR Conférences
- Chargez le jeu de données
- Reconciliez avec les conférences sur Wikidata
- Quelles informations supplémentaires pouvez vous ajouter aux autorités locales de type https://library.icrc.org/library/search/authority?authorityId=77293
Session 2
[edit]Jeu de données 002 BGE - Archives. Ces 370 personnes ont leurs archives conservées à la BGE. Néanmoins, ceci n'est pas signalé dans wikidata (à part pour 33 d'entre elles). Nous allons compléter ce manque aujourd'hui et la prochaine fois. La première étape est de définir lesquelles de ces personnes (ou familles) sont présentes sur wikidata.
- Chaque étudiant prend un lot de 15 archives (cf. sous-répertoire lots) et étudie avec précision si ces personnes sont sur wikidata.
- Il faut ajouter une colonne wikidata-id qui contient le no. Q correspondant si cette personne existe
- Et récupérer depuis wikidata la proprité P485 pour voir si l'archive est déjà signalée
Pour les personnes qui sont sur wikidata, mais où l'archive à la BGE n'est pas signalée, il faut ajouter le lien à la main sur wikidata.
Puis, pour les personnes qui ne sont pas sur wikidata du tout, nous allons les charger sur wikidata depuis openrefine en remplissant les champs suivants :
- Nom, prénom
- Année de naissance
- Année de décès
- "Archives conservées par" (P485) avec comme valeur la BGE Q679689. Comme "qualificatif"
- taille de la collection (P1436)
- titre (P1476)
- numéro d'inventaire (si il existe) (P217)
- décrit à l'url (P973)

Session 3
[edit]slido.com 364 85 89
Session 4
[edit]Référence : https://librarycarpentry.github.io/lc-open-refine/13-looking-up-data.html#looking-up-data-from-a-url
Exercice 1 : Jeu de données 005
- Chargez le jeu de données 005 sur l'univers dans OpenRefine
- En vous basant sur l'ISBN, déterminez si les documents se trouvent dans Rero. Informations détaillées ci-dessous. Utiliser "Add column by fetching url" dans OpenRefine
Exercice 2 : Jeu de données 004
- Chargez le jeu de données 004 des publications de l'université de Neuchâtel
- Pour les 23 publications de 2011, en vous basant sur le titre et les auteurs, récupérez les doi manquants depuis crossref en suivant la documentation : https://api.crossref.org/works?query.title=room+at+the+bottom&query.author=richard+feynman (attention aux + qui remplacent les espaces). Comparez avec les doi existants dans le jeu de données pour voir si cela a fonctionné.
Exportez les deux fichiers obtenus au format csv et envoyez-les moi par email.
Session 5-6
[edit]Jeu de données 016 "Vues de la Suisse" Adolphe Braun
Chaque étudiant prend un lot et charge 5 images pertinentes avec un maximum de données structurées sur Wikimedia Commons avec OpenRefine.
Challenges pour les travaux de groupes
[edit]Personnalités genevoises - Bibliothèque de Genève
[edit]https://archives.bge-geneve.ch/archive/catalogue/categoriefonds/personnes-et-familles/n:90
Jeu de données 002 BGE - Archives. Ces 370 personnes ont leurs archives conservées à la BGE. Néanmoins, ceci n'est pas signalé dans wikidata (à part pour quelques-unes d'entre elles). Nous allons compléter ce manque !
Etapes
- Supprimer les lignes non pertinentes (familles, etc.)
- Nettoyer les données (nom, prénom, identifiant ark incorrect)
- Récupérer les biographies et les fonctions depuis le site de la BGE (exemple https://archives.bge-geneve.ch/ark:/17786/vta4062cdc80383c5e9). Truc OpenRefine :
value.parseHtml().select("li.descrip_sous_titre").join("|"). Pour récupérer un champ particulier (par exemples Dates d'existence) :value.parseHtml().select("li.descrip_sous_titre:contains(Existence) div")[0].htmlText() - [Optionnel] En extraire les informations essentielles (avec AI)
- Réconcilier avec wikidata
- Et récupérer depuis wikidata la proprité P485 pour voir si l'archive est déjà signalée
Pour les personnes qui sont sur wikidata, mais où l'archive à la BGE n'est pas signalée, il faut ajouter le lien à la main sur wikidata.
Puis, pour les personnes qui ne sont pas sur wikidata du tout, nous allons les charger sur wikidata depuis openrefine en remplissant les champs suivants :
- Nom, prénom
- Année de naissance
- Année de décès
- Métier
- Description
- Label
- "Archives conservées par" (P485) avec comme valeur la BGE Q679689. Comme "qualificatif"
- taille de la collection (P1436)
- titre (P1476)
- numéro d'inventaire (si il existe) (P217)
- décrit à l'url (P973)
Par la suite, il est possible de créer ou de mettre à jour éventuellement des pages Wikipedia pour ces personnes.

Enrichissement via doi - Libra - Université de Neuchâtel
[edit]https://libra.unine.ch/entities/orgunit/7df9cbdf-d94b-4e14-9e45-60cdee6ba619/publications
Jeu de données 004
En vous basant sur le titre et les auteurs, récupérez les doi manquants depuis crossref en suivant la documentation : https://api.crossref.org/works?query.title=room+at+the+bottom&query.author=richard+feynman (attention aux + qui remplacent les espaces). Comparez avec les doi existants dans le jeu de données pour voir si cela a fonctionné.
Etapes
- Nettoyage des données (institutions à séparer)
- Enrichissement des doi
- Vérifications
- Ajout d'informations utiles (par exemple le nombre de citations depuis crossref https://api.crossref.org/works/10.1371/journal.pone.0123720) pour trouver les publications les plus citées de l'institut
Photographies aériennes Air Color SA - ETH Zürich
[edit]https://ba.e-pics.ethz.ch/#categories-node=085fe125-01e1-4106-9cbe-6b0c8d05c2ba
Jeu de données 017
Ces photos (à part une seule) ne sont pas sur Wikimedia commons. Les charger (ou une partie)
- Réconciliation avec Wikidata
- Définir le schéma de chargement
- Charger les photos (tif haute résolution)
- Métadonnées à mettre (Suivre cet exemple https://commons.wikimedia.org/wiki/File:ETH-BIB-Rheinau-AIC_02-EE-152010-002.tif)
- Nom du fichier ETH-BIB-Titel-Bildcode, Bsp. ETH-BIB-Rheinau-AIC 02-EE-152010-002 sans .tif à la fin
- Cette catégorie Commons doit être présente https://commons.wikimedia.org/wiki/Category:ETH-BIB_AirColor-Luftbild
- photographer
- title
- descripiton (falls vorhanden)
- medium
- dimensions
- institution:
{{Institution:ETH-Bibliothek}}à In der Excel-Liste bereits Spalte hinzugefügt - notes (si disponible)
- accession number: ETH-BIBlithek_Bildcode à in der Excel-Liste bereits gemäss den Vorgaben erstellt
- source: E-Pics Bildarchiv online DOI-Link
{{Template:ETH-Bibliothek}} - Permission:
{{cc-by-sa-4.0}} - depicts (P180) : avec le nom de la ville/village qui est sur la photo
Archives d'entreprises - Archives économiques suisses (Bâle)
[edit]Jeu de données 018
Voici environ 250 entreprises avec leurs archives aux Archives Economiques Suisses à Bâle.
Mais elles sont très peu signalées sur wikidata. Seulement une vingtaine.
Le but est de compléter ceci, de manière similaire au challenge "Personnalités genevoises"
Vues de la Suisse - Musée national suisse (Zürich)
[edit]1600 photos historiques de la Suisse
Jeu de données 016
Le but est de charger ces photos historiques de la suisse sur Wikimedia Commons
Photos historiques de la région de Zoug - Bibliothèque de Zug
[edit]https://zentralgut.ch/glasplatten_zug/
Jeu de données 014
Photos historiques de la région de Zug avec les coordonnées géographiques.
Le but est de charger ces photos historiques de la suisse sur Wikimedia Commons
Interrogation des catalogues par API
[edit]RERO
[edit]Documentation : https://bib.rero.ch/help/api/ et https://bib.rero.ch/help/recherche-exemples/
Exemples :
- Informations bibliographiques pour le document d'identifiant 2140202 : https://bib.rero.ch/api/documents/2140202
- Détail de l'item d'un document avec un item_pid qui vaut 3292704 : https://bib.rero.ch/api/items/3292704
- Recherche ISBN https://bib.rero.ch/api/documents/?q=isbn:9782916571706
- Recherche dans tous les champs https://bib.rero.ch/api/documents/?q=algebre+AND+dalang (équivalent dans le catalogue)
swisscovery (SLSP)
[edit]Documentation : https://slsp.ch/fr/metadonnees/
Exemples :
- Information bibliographiques pour le document ayant le MMS ID 991000848779705520 pour la IZ HPH : https://slsp-network.alma.exlibrisgroup.com/view/sru/41SLSP_HPH?version=1.2&operation=searchRetrieve&recordSchema=marcxml&query=mms_id=991000848779705520
- Recherche ISBN https://slsp-network.alma.exlibrisgroup.com/view/sru/41SLSP_HPH?version=1.2&operation=searchRetrieve&recordSchema=marcxml&query=isbn=9782364051218
- Recherche dans tous les champs des mots "data lejeune" https://slsp-network.alma.exlibrisgroup.com/view/sru/41SLSP_HPH?version=1.2&operation=searchRetrieve&query=all%20all%20%22data%20lejeune%22 (équivalent dans le catalogue
Plus d'exemples dans la documentation de la ZB Zürich
Crossref (doi)
[edit]Récupérer les doi manquants depuis crossref en suivant la documentation : https://api.crossref.org/works?query.title=room+at+the+bottom&query.author=richard+feynman (attention aux + qui remplacent les espaces, utiliser la fonction GREL escape en mode url)
Utiliser des données d'une autre colonne dans OpenRefine :
"https://api.crossref.org/works?query.title="+value+"&query.author="+cells.Authors.value.split(",")[0]
Reconciliation IdRef
[edit]Il n'y a pas de réconciliation directe via IdRef qui est possible depuis OpenRefine.
Le plus simple est d'utiliser le service web qui met Solr directement à disposition.
Jeux de données
[edit]001 Carouge
[edit]- Export Catalogue
- 3269 notices
- Auteur / Titre / Cote 1 / Cote 2 / Cote 3 / Dernière année de prêt
Objectif : ?
002 BGE Archives
[edit]- Liste des personnes dont les archives se trouvent à la BGE
- 418 notices
- Isad311Référence Isad312Intitulé Isad313Dates Isad313DatesNormees Isad315ImportanceMatérielle Isad321NomProducteur Marc100Personnalité CategorieFonds TypeInstrumentRecherche Ark
Objectif : Relier à Wikidata et importer éventuellement
Exemple : https://www.wikidata.org/wiki/Q286062, "archives conservées par"
003 BGE Compositeurs
[edit]- Liste des compositeurs de partitions de la BGE (extrait de Alma)
- 17'724 notices
- Nom / id idref / id autorité rero / nombre de documents de cette personne
Objectif : Déterminer les femmes compositrices genevoises (ou suisses). Ou ayant un lien avec Genève (séjour, études, ...)
004 Bibliothèque des sciences économiques Université de Neuchâtel
[edit]- Il s'agit d'un extrait de Libra : la plateforme de dépôt institutionnel de l'UniNE. Ce sont toutes les publications des membres de l'institut des recherches économiques.
- 517 notices
- Title Subtitle Type Language Publication date Part of Journal or Serie ISBN (of the container) ISSN (of the container) DOI (of the container) Publisher DOI ISBN ISSN ISI-Number SCP-Number Volume Issue Start page End page Authors Editors Abstract Event Product
Objectif : Récupérer les doi (absent pour 392 notices) de crossref. Nettoyer les dates. Récupérer des identifiants d'auteurs. Catégoriser en se basant sur les abstracts.
005 SEM Genève Univers
[edit]- Une liste bibliographique de tous les documentaires sur le thème de l'univers que nous avons à la médiathèque, afin de peut-être en désherber
- 36 notices
- Titre 1er responsabilité Responsabilité secondaire Lieu de publication éditeur Date de publication Collection Langue du document Titre de série ISBN Résumé Collation Bibliothèque Cote Code-barres
Objectif : ?
006 SEM Genève CDU 900
[edit]- Tous les documents avec une CDU 900. Il n'y a pas de titre de colonnes.
- 8079 notices
Objectif : supprimer les doublons ?
007 Versoix
[edit]- ?
- 52 notices
- No d'exemplaire Type de média 1 Centre d'intérêt Catégorie d'âge Auteur Titre Volume Langue Année de parution 1 Cote Marque Emplacement Dernier prêt Prêts (total)
Objectif : ?
008 Delémont
[edit]- export Rero
- 723 notices
- document_pid document_title document_creator document_main_type document_sub_type document_masked document_isbn document_issn document_series_statement document_edition_statement document_publication_year document_publisher document_local_field_1 document_local_field_2 document_local_field_3 document_local_field_4 document_local_field_5 document_local_field_6 document_local_field_7 document_local_field_8 document_local_field_9 document_local_field_10 item_acquisition_date item_pid item_create_date item_barcode item_call_number item_second_call_number item_legacy_checkout_count item_type item_library_name item_location_name item_pac_code item_holding_pid item_price item_status item_item_type item_general_note item_staff_note item_checkin_note item_checkout_note item_acquisition_note item_binding_note item_condition_note item_patrimonial_note item_provenance_note temporary_item_type temporary_item_type_expiry_date item_masked item_enumerationAndChronology item_local_field_1 item_local_field_2 item_local_field_3 item_local_field_4 item_local_field_5 item_local_field_6 item_local_field_7 item_local_field_8 item_local_field_9 item_local_field_10 issue_status issue_status_date issue_claims_count issue_expected_date issue_regular item_checkouts_count item_renewals_count last_transaction_date last_checkout_date current_pending_requests
Objectif : Filtrer en se basant sur local_field sous-champ
009 Bib. Cant. Jura Inventaire Jobin
[edit]- Inventaire d'un don ?
- ~130 notices
- N0 AUTEUR TITRE ÉDITIONS LIEU D'ÉDITION DATE NOTES
Objectif : nettoyer le fichier, supprimer les en-têtes intercalées, récupérer les notices correspondantes, voir si il est déjà dans le catalogue
010 Bib. Cant. Jura Jukoby
[edit]- Export catalogue (rero) Fonds jukoby
- 1993 notices
- document_pid document_title document_creator document_main_type document_sub_type document_masked document_isbn document_issn document_series_statement document_edition_statement document_publication_year document_publisher document_local_field_1 document_local_field_2 document_local_field_3 document_local_field_4 document_local_field_5 document_local_field_6 document_local_field_7 document_local_field_8 document_local_field_9 document_local_field_10 item_acquisition_date item_pid item_create_date item_barcode item_call_number item_second_call_number item_legacy_checkout_count item_type item_library_name item_location_name item_pac_code item_holding_pid item_price item_status item_item_type item_general_note item_staff_note item_checkin_note item_checkout_note item_acquisition_note item_binding_note item_condition_note item_patrimonial_note item_provenance_note temporary_item_type temporary_item_type_expiry_date item_masked item_enumerationAndChronology item_local_field_1 item_local_field_2 item_local_field_3 item_local_field_4 item_local_field_5 item_local_field_6 item_local_field_7 item_local_field_8 item_local_field_9 item_local_field_10 issue_status issue_status_date issue_claims_count issue_expected_date issue_regular item_checkouts_count item_renewals_count last_transaction_date last_checkout_date current_pending_requests
Objectif : ?
011 Châtelaine
[edit]- Nouvelles acquisitions jeunesse
- 64 notices
- Titre construit EAN / ISBN ARK Toutes les langues de l'expression Toutes les langues originales Toutes les langues des sous-titre Toutes les autres langues 1er responsable Date de publication Lieu de publication Importance matérielle Série N° dans série
Objectif : filtrer les auteurs sur un critère wikidata ?
012 CICR
[edit]- Autorités Conférences du CICR
- 33 notices
- id, type, titre conférence, lien catalouge
Objectif : enrichir depuis wikidata
013 HEP BEJUNE
[edit]- Export catalogue
- 363 notices
- Titre Code-barres Bibliothèque Bibliothèque temporaire Date de création Date de modification Type de processus Vers la bibliothèque En bibliothèque à Date d'expiration de réservation Date de retour Emplacement permanent Localisation temporaire Cote Cote temporaire Statut Exception de circulation Type de matériel Demandes Identifiant MMS Date de réception Note interne 2
Objectif : Exception de circulation (colonne R) = actuellement 04 ou 71. A modfier en 65 Prêt à la journée, pas de courrier/envoi postal, pas de service de numérisation
014 Photographies historiques de la région de Zug
[edit]3500+ photos historiques de la région de Zug avec coordonnées géographiques
015 Vues de la Suisse - Extrait
[edit]C'est un extrait de 5 photos du jeu de données 016 ci-dessous
016 Vues de la Suisse - Tout
[edit]1600+ photos historiques de toute la Suisse du Musée National à Zürich. Photos de Adolphe Braun & Cie.
Exemples de recherches SPARQL
[edit]Tous les livres écrits par J. K. Rowling
[edit]- Entités et propriétés pertinentes : J. K. Rowling (Q34660), author (P50)
SELECT ?book ?bookLabel
WHERE {
?book wdt:P50 wd:Q34660 .
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
}
Quelles informations sont disponibles sur les livres de J.K. Rowling
[edit]- Entités et propriétés pertinentes : publisher(P123), publication Date(P577), award received (P166)
SELECT ?book ?bookLabel ?publisherLabel ?publicationDate ?awardsLabel
WHERE {
?book wdt:P50 wd:Q34660 .
?book wdt:P123 ?publisher;
wdt:P577 ?publicationDate;
wdt:P166 ?awards .
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
}
Informations disponibles dans tous les livres
[edit]- Il faut utiliser le mot clé OPTIONAL pour conserver tous les résultats.
SELECT ?book ?bookLabel ?publisherLabel ?publicationDate ?awardsLabel
WHERE {
?book wdt:P50 wd:Q34660 .
OPTIONAL {?book wdt:P123 ?publisher .}
OPTIONAL {?book wdt:P577 ?publicationDate .}
OPTIONAL {?book wdt:P166 ?awards .}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
}
Entités nommées d'après un président français
[edit]#defaultView:Map
SELECT ?truc ?presLabel ?trucLabel ?coord ?layer WHERE {
{
SELECT DISTINCT ?truc (SAMPLE(?coord) AS ?coord) (SAMPLE(?layer) AS ?layer) WHERE {
?pres wdt:P39 wd:Q191954 ;
rdfs:label ?layer.
FILTER((LANG(?layer)) = "fr")
?truc wdt:P138 ?pres ;
wdt:P625 ?coord.
}
GROUP BY ?truc ?trucLabel
}
SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}
Entités nommées d'après des conseillers fédéraux suisses
[edit]#defaultView:Map
SELECT ?truc ?fcLabel ?trucLabel ?coord ?layer WHERE {
{
SELECT DISTINCT ?truc (SAMPLE(?coord) AS ?coord) (SAMPLE(?layer) AS ?layer) WHERE {
?fc wdt:P39 wd:Q11811941 ;
rdfs:label ?layer.
FILTER((LANG(?layer)) = "fr")
?truc wdt:P138 ?fc ;
wdt:P625 ?coord.
}
GROUP BY ?truc ?trucLabel
}
SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}
Liste d'écrivaines de nationalité suisse
[edit]SELECT ?writer ?writerLabel ?birthDate ?deathDate WHERE {
# L'élément est une personne
?writer wdt:P31 wd:Q5;
# L'élément est un écrivain
wdt:P106 wd:Q36180;
# La nationalité est suisse
wdt:P27 wd:Q39;
# Le genre est féminin
wdt:P21 wd:Q6581072.
# Facultatif : Date de naissance et de décès
OPTIONAL { ?writer wdt:P569 ?birthDate. }
OPTIONAL { ?writer wdt:P570 ?deathDate. }
# Service pour obtenir les étiquettes
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr". }
}
ORDER BY ?writerLabel
Liste de compositeurs nés à Genève
[edit]SELECT ?composer ?composerLabel ?birthDate ?deathDate WHERE {
# L'élément est une personne
?composer wdt:P31 wd:Q5;
# L'élément est un compositeur
wdt:P106 wd:Q36834;
# Le lieu de naissance est Genève
wdt:P19 wd:Q71.
# Facultatif : Date de naissance et de décès
OPTIONAL { ?composer wdt:P569 ?birthDate. }
OPTIONAL { ?composer wdt:P570 ?deathDate. }
# Service pour obtenir les étiquettes
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr". }
}
ORDER BY ?composerLabel
Galerie photos des artistes ayant joué au Montreux Jazz Festival
[edit]#defaultView:ImageGrid
SELECT DISTINCT ?wd_item ?wd_item_label ?pic
WHERE {
?wd_item wdt:P8301 ?mjf_person_id .
OPTIONAL {
?wd_item wdt:P18 ?pic
}
SERVICE wikibase:label {
bd:serviceParam wikibase:language "en" .
?wd_item rdfs:label ?wd_item_label
}
}
Instruments les plus utilisés au Montreux Jazz Festival
[edit]#defaultView:BubbleChart
SELECT DISTINCT ?wd_instrument ?instrument_name (count(?wd_instrument) as ?c_instrument)
WHERE {
{ ?wd_item wdt:P8301 ?mjf_person . }
OPTIONAL { ?wd_item wdt:P1303 ?wd_instrument . }
SERVICE wikibase:label {
bd:serviceParam wikibase:language "en" .
?wd_instrument rdfs:label ?instrument_name
}
}
GROUP BY ?wd_instrument ?instrument_name ?c_instrument
ORDER BY DESC(?c_instrument)
Lieux de naissances des artistes qui se sont produits au Montreux Jazz Festival
[edit]#defaultView:Map
SELECT DISTINCT ?artist_name ?place_name ?wd_item ?coor ?birth_place
WHERE {
{ ?wd_item wdt:P8301 ?mjf_person_id . }
{ ?wd_item wdt:P19 ?birth_place . }
{ ?birth_place wdt:P625 ?coor . }
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en".
?wd_item rdfs:label ?artist_name .
?birth_place rdfs:label ?place_name .
}
}
Timeline des concerts de Miles Davis au Montreux Jazz Festival
[edit]#defaultView:Timeline
SELECT DISTINCT ?concert_mjf ?concert_name ?wd_time ?location_name
WHERE {
{ ?concert_mjf wdt:P8300 ?wd_item } .
{ ?concert_mjf wdt:P710 wd:Q93341 } .
OPTIONAL { ?concert_mjf wdt:P361 ?wd_part_of } .
OPTIONAL { ?concert_mjf wdt:P276 ?wd_location } .
OPTIONAL { ?concert_mjf wdt:P585 ?wd_time } .
SERVICE wikibase:label {
bd:serviceParam wikibase:language "en" .
?concert_mjf rdfs:label ?concert_name .
?wd_location rdfs:label ?location_name .
}
}
GROUP BY ?concert_mjf ?concert_name ?location_name ?wd_time
Personnes dont les archives sont conservées à la Bibliothèque de Genève
[edit]SELECT ?person ?personLabel
WHERE {
?person wdt:P485 wd:Q679689 . # Personne ayant des archives conservées par la bibliothèque de Genève (Q679689)
?person wdt:P31 wd:Q5 . # La personne est un être humain
SERVICE wikibase:label { # Pour obtenir les labels en langue lisible
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en,fr" .
}
}
LIMIT 100
Carte des bibliothèques suisses
[edit]Un autre type de visualisation :
Carte des bibliothèques en Suisse, Allemagne, Autriche et Liechtenstein.
Liens et références
[edit]- Le cours à Bern et Zürich https://www.wikidata.org/wiki/User:Beat_Estermann/
- https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/
- https://fr.wikipedia.org/wiki/Projet:Suisse/How-to_archivistes
- SPARQL simplifié IdRef (Yasgui) : https://data.idref.fr/yasgui.html
- Introduction OpenRefine https://librarycarpentry.github.io/lc-open-refine/
- OpenRefine online https://hub-paws.wmcloud.org/ avec votre compte wikimedia