User talk:PAC2

Jump to navigation Jump to search

About this board

Previous discussion was archived at User talk:PAC2/Archive 1 on 2015-11-13.

Gentilé et élément sur les peuples

2
VIGNERON (talkcontribs)

Salut,

Je réfléchis à la remarque sur la RfC par rapport à Allemands(42884) et je ne suis pas sûr que ce soit vraiment un cas similaire où la RfC devrait s'appliquer. Ces éléments ne sont pas des gentilés formellement mais le peuple. On n'est pas sur un individu (comme pour les métiers/occupations/fonctions) mais sur un groupe de personne. « Allemands ou Allemandes » serait vraiment étrange ici et plutôt incorrect, à la limite ou pourrait écrire « Allemands et Allemandes » qui serait plus juste mais toujours bizarre...

PAC2 (talkcontribs)

Oui je me pose la même question. L'enjeu est un peu différent.

Reply to "Gentilé et élément sur les peuples"
Fralambert (talkcontribs)

Tien, tu en avais oublié un. j'ai corrigé spouse (P26) suite à ton dernier RfC.

PAC2 (talkcontribs)

Merci. C'est étrange je ne l'ai pas vu dans ma requête :

The following query uses these:

  • Properties: female form of label (P2521)  , male form of label (P3321)  , property constraint (P2302)  , class (P2308)  , relation (P2309)  
    #title: List of properties which have instances or subclass of humans as possible value with male and female form in French
    SELECT ?property ?propertyLabel ?maleform ?femaleform (GROUP_CONCAT(?alias; SEPARATOR = ", ") AS ?aliases) WHERE {
      ?property p:P2302 ?statement.
      ?statement ps:P2302 wd:Q21510865;
        pq:P2308 wd:Q5;
        pq:P2309 ?relation.
      ?property rdfs:label ?propertyLabel.
      OPTIONAL {
        ?property skos:altLabel ?alias.
        FILTER((LANG(?alias)) = "fr")
      }
      FILTER((LANG(?propertyLabel)) = "fr")
      OPTIONAL {
        ?property wdt:P2521 ?femaleform.
        FILTER((LANG(?femaleform)) = "fr")
      }
      OPTIONAL {
        ?property wdt:P3321 ?maleform.
        FILTER((LANG(?maleform)) = "fr")
      }
    }
    GROUP BY ?property ?propertyLabel ?maleform ?femaleform
    
Reply to "P26"
Bouzinac (talkcontribs)
PAC2 (talkcontribs)
Bouzinac (talkcontribs)

Cool. Il faudrait aussi l'équivalent limité à la ligne proprement dite (ex que la ligne 14)... C'est possible ?

PAC2 (talkcontribs)
Bouzinac (talkcontribs)

Je me suis permis de déboguer | doit être précodé {{!}}

PAC2 (talkcontribs)

Merci beaucoup. Tu vois d'autres requêtes qu'on pourrait ajouter pour les réseaux de transport ? Liste des lignes sous forme de tableau ? Station la plus centrale dans le réseau ?

Bouzinac (talkcontribs)

Que dirais-tu de ça (à noter que dans cet exemple, j'ai du mal à dédoublonner certaines fourches, ex Nation ou La Défense...). Hello VIGNERON, je me permets de te pinguer : une idée dans cet use-case (présenter une ligne de métro/RER/tramway avec une requête la plus générique possible) ?

#title: ?searchLabel
#defaultView:Map{"hide":["?coords", "?line_number", "?line", "?search","?logo", "?rgb"]}
SELECT ?station ?stationLabel ?coords ?line_number ?search ?searchLabel ?line ?rgb ?logo
(sample (?image) as ?imag) (sample(?image_panneau) as ?panneau) WHERE {
  VALUES ?search {
    wd:Q741818
  }
   ?search wdt:P559 ?termini.
  ?station (wdt:P31/(wdt:P279*)) wd:Q548662;
    wdt:P5817 wd:Q55654238;
    wdt:P625 ?coords;
    (wdt:P81|wdt:P1192) ?search;
    wdt:P197 ?pred.
  ?pred wdt:P625 ?coords_pred;
    (wdt:P81|wdt:P1192) ?subwayLine_pred.
  ?station p:P197 _:b1.
  _:b1 ps:P197 ?pred;
    pq:P5051 ?towards;
    (pq:P81|pq:P1192) ?line_pq.
  ?pred wdt:P5817 wd:Q55654238.
  OPTIONAL { ?search wdt:P1671 ?line_number. }
  OPTIONAL { ?search wdt:P154 ?logo.}
  optional {?station wdt:P18 ?image.}
  optional {?station wdt:P1766 ?image_panneau.}
  FILTER(?subwayLine_pred = ?search)
  FILTER(?towards = ?termini)
  ?pred p:P625 ?node_pred.
  ?node_pred (psv:P625/wikibase:geoLatitude) ?lat1;
    (psv:P625/wikibase:geoLongitude) ?lon1;
    rdf:type wikibase:BestRank.
  ?station p:P625 ?node_station.
  ?node_station (psv:P625/wikibase:geoLatitude) ?lat2;
    (psv:P625/wikibase:geoLongitude) ?lon2;
    rdf:type wikibase:BestRank.
  BIND(CONCAT("LINESTRING(", STR(?lon1), " ", STR(?lat1), ",", STR(?lon2), " ", STR(?lat2), ")") AS ?str)
  BIND(STRDT(?str, geo:wktLiteral) AS ?line) 
  ?search wdt:P465 ?rgb.
  SERVICE wikibase:label {
    bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en,fr".
    ?pred rdfs:label ?predLabel .
    ?search rdfs:label ?searchLabel.
    ?station rdfs:label ?stationLabel.
  }
} group by ?station ?stationLabel ?coords ?line_number ?search ?searchLabel ?line ?rgb ?logo
ORDER BY ?coords
?searchLabel
PAC2 (talkcontribs)

C'est impressionnant mais du coup j'ai l'impression que c'est plutôt une requête pour les lignes de transport que pour les réseaux, non ?

Bouzinac (talkcontribs)

Ben oui, l'objectif est d'avoir deux cartes bien différentes, qui ont leur propres règles de gestion : une carte "générale" de type réseau, c'est la première. Et puis une carte centrée sur une ligne. ça pourrait être tout type de transport (voir par ex les ferry de Vancouver) mais généralement Wikidata est mieux renseignée en stations de métro qu'en gares ou qu'en gares maritimes etc.

PAC2 (talkcontribs)
Bouzinac (talkcontribs)

Au niveau réseau de transport, ce serait donc trois cartes possibles

  • la carte réseau, telle qu'on devrait la lire sur le site officiel de l'opérateur
  • la carte du réseau futur et passé (c'est à dire sans les trucs en construction/projet)
  • la carte des points tout bête, sans lignes.
Thierry Caro (talkcontribs)

Une carte juste avec les points d'arrêt serait appréciable. Parfois l'affichage de lignes passantes crée l'impression d'une grande densité dans des coins qui en fait sont dépourvus en stations. C'est donc toujours bien de pouvoir afficher les stations seules.

PAC2 (talkcontribs)

Tu veux dire sans tracer les lignes ?

Thierry Caro (talkcontribs)

C'est ça. Et on pourrait afficher les dépôts ferroviaires renseignés via train depot (P834) avec des points d'une autre couleur que celle des stations si on veut un truc un peu plus élaboré qu'une simple distribution de points. Ou alors mettre les stations sur plus d'une ligne en plus gros ?

Reply to "Template Item Doc"
Pa2chant.bis (talkcontribs)
PAC2 (talkcontribs)

Oui dans ce que j'ai proposé au vote, j'ai mis

Concerning properties whose target value is a human such author (P50), if the male form is different from the female form, it is recommended to use :
  • both male and female form if possible (ie "auteur ou autrice")
  • a verbal form if it's to complex to use female and male form.

L'idée c'est que les formes contractées de doubles épicènes ne font pas consensus. En revanche, on peut très bien choisir entre une forme nominale et une forme verbale. Par exemple, j'ai lancé un débat ici : Property_talk:P57#French label.

N'hésite pas à lancer le débat sur editor (P98) si tu penses que c'est mieux.

PAC2 (talkcontribs)
Pa2chant.bis (talkcontribs)

Merci pour l'explication. Pour le moment, j'en suis surtout à tenter de comprendre comment tout ceci s'articule, entre propriétés, lexèmes, formes féminines/masculines...et je nage un peu (voir sujet "pour mémoire" sur ma PDD).

J'ai notamment eu l'impression , pour les lexèmes, quand j'avais regardé le sujet, qu'il y avait 2 acceptions différentes du mot, sans compter que je n'ai pas encore compris l'architecture des données, et notamment comment on pouvait à partir d'un élément, récupérer son ou ses lexèmes.


Je regarde pour ton débat. Cdlt

PAC2 (talkcontribs)

Oui c'est pas facile. Je n'ai pas encore pas bien compris les lexemes. J'ai fait une première requête SPARQL, pour faire un lien entre des éléments et des lexemes : User:PAC2/Gender_neutral_labels#Queries_with_Lexemes.

N'hésite pas à me poser des questions si je peux aider.

Pa2chant.bis (talkcontribs)

Merci pour la requête, je l'avais déjà repérée et c'est à partir d'elle que j'ai alimentée mes questions du jour sur ma PDD.Il faudrait que je fasse la synthèse des pb que j'avais repéré il y a quelques mois avec ces 2 acceptions et donc utilisations constatées de la notion de lexème dans WD.


Sinon, une question toute bête : connais-tu un moyen simple d'accéder à un lexème à partir d'un élément Wikidata, ou bien est-on condamné à passer par des requêtes ?

PAC2 (talkcontribs)

Mon idée c'était justement d'ajouter une requête générique de type

The following query uses these:

  • Properties: item for this sense (P5137)  
    select ?string ?lexeme ?languageLabel ?lemma {
    ?sense wdt:P5137 wd:Q634 .
    ?lexeme ontolex:sense ?sense .
    ?lexeme dct:language ?language .
    ?lexeme wikibase:lemma ?lemma .
    BIND ( str(?lemma) AS ?string )
    ?language rdfs:label ?languageLabel filter (lang(?languageLabel) = "[AUTO_LANGUAGE]") .
    }
    

au template {{Item documentation}}. Comme ça on aurait le lien en un clic depuis l'en tête de la page de discussion.

Pa2chant.bis (talkcontribs)

ça marche mais c'est lunaire ce truc. Tu serais obligé de l'ajouter sur chaque page de discussion vierge ?

PAC2 (talkcontribs)

Non maintenant ça apparaît directement dans l'en-tête de la page de discussion grâce à MediaWiki:Talkpageheader. C'est ma victoire de ces dernières semaines.

Pa2chant.bis (talkcontribs)

Bravo !!!

PAC2 (talkcontribs)

J'ai tenté un truc dans le bac à sable du Template.

Pa2chant.bis (talkcontribs)

Je ne parle pas le wikidatien Autrement dit, je ne sais pas accéder à ce bac à sable pour voir les évolutions que tu testes...

PAC2 (talkcontribs)

Si tu vas sur cette page Template:Item documentation/testcases, on compare la version actuelle du modèle et la version bac à sable. Dans la version bac à sable, on voit le lien vers la requête qui trouve les lexemes correspondants. PAC2 (talk) 20:38, 19 June 2022 (UTC)

Reply to "Féminin, masculin, verbe"
VIGNERON en résidence (talkcontribs)
PAC2 (talkcontribs)

Très cool

Reply to "Jupyter Notebook"
VIGNERON (talkcontribs)

Bonjour,

Juste une remarque en marge de ta discussion sur le PC à propos de female form of label (P2521)/male form of label (P3321), ces propriétés (et peut-être même les libellés eux-mêmes) sont appelés à disparaître (par suppression ou par inutilisation) à plus ou moins long terme. Les Lexèmes L sont l'espace prévu pour les données lexicographiques (WD:LD) plutôt que les éléments Q (dont les libellés/descriptions sont une partie à part déjà) et cette distinction ne devrait que se renforcer à l'avenir.

PAC2 (talkcontribs)

Merci pour l'info.

Je m'en doutais un peu. Pour l'instant les lexemes restent un peu abstraits pour moi et je ne vois beaucoup d'utilisations passer.

Du coup, ça veut dire que mon idée de lancer une propriété "forme inclusive du libellé" n'est pas forcément la bonne.

Je vais voir ce qu'on peut faire du côté des lexemes. PAC2 (talk) 11:59, 30 October 2021 (UTC)

VIGNERON (talkcontribs)

Avec plaisir.

Ton idée n'est pas mauvaise mais elle sera sans doute périmée dans les années à venir.

Les données lexicographiques ne sont pas toujours simples mais à terme elles sont "meilleures" (ou en tout cas, le format Lexeme est plus adaptée). Et si tu as des questions, n'hésite pas à demander (notamment sur les requêtes SPARQL sur les Lexèmes sont très spécifiques).

PAC2 (talkcontribs)

D'acc. Je vais regarder pour les requêtes avec les lexemes. PAC2 (talk) 20:38, 30 October 2021 (UTC)

PAC2 (talkcontribs)

Pour le moment, ça donne ça :

#title: List of lexemes in French about occupation items with gender
SELECT DISTINCT ?item ?itemLabel ?sense ?lexeme ?lemma ?genre ?genreLabel WHERE {
  ?lexeme rdf:type ontolex:LexicalEntry;
    dct:language wd:Q150;
    wikibase:lemma ?lemma;
    ontolex:sense ?sense;
    wdt:P5185 ?genre.
  ?sense wdt:P5137 ?item.
  ?item (wdt:P31/(wdt:P279*)) wd:Q12737077;
    rdfs:label ?itemLabel.
  FILTER((LANG(?itemLabel)) = "fr")
  ?genre rdfs:label ?genreLabel.
  FILTER((LANG(?genreLabel)) = "fr")
}
ORDER BY (?item) (?lemma) (?genre)
List of lexemes in French about occupation items with gender

Y a pas beaucoup de lexemes encore et la classification en féminin, masculin et épicène n'est pas toujours très claire.

VIGNERON (talkcontribs)

@Nattes à chat, Hsarrazin, Jsamwrites: que le sujet peu intéressé aussi.

Pour avancer par rapport aux lexèmes, comme tu l'a noté, il y a actuellement très peu de Lexèmes en français : 12 000 seulement et ceux existant sont souvent assez vides donc inutile (typiquement, il y a tout un tas de métier qui ont un lexème mais ne sont pas indiquer comme tel et n'apparaissent donc pas dans ta requête). Avant-hier, je viens de faire une passe sur une série d'une centaine de Lexèmes (par exemple, ceux finissent en -ier qui sont généralement au masculin, -ière au féminin, etc.) mais j'aurais besoin d'aide.

La structure des lexèmes n'est pas toujours encore bien fixée, notamment par manque de sources lexicographiques et grammaticales. Si vous avez des ressources en particulier sur la lexicographie et la grammaire neutre/épicène/inclusive, je suis preneur (par exemple, il me semble que personne ne considère jamais "épicène" comme un "genre grammatical" mais je peux me tromper, or c'est important pour l'utilisation de la propriété genre grammatical(P5185)).

Est-ce que cela vous intéresse de se coordonner pour améliorer les lexèmes ? (surtout avec Wikifunctions et l'Abstract Wikipedia qui devrait être lancés officiellement dans quelques mois).

PAC2 (talkcontribs)

Intéressé pour contribuer. Est ce qu'on ne pourrait pas créer un Wikiprojet sur les données lexicographiques en français ou plus généralement sur le français dans Wikidata.

VIGNERON (talkcontribs)

Il est possible d'utiliser la page de discussion principale Wikidata:Lexicographical data (si on met en place des méthodes, ce serait utile de les partager et d'avoir des retours par rapports aux autres langues ; toutes les langues du monde possédant un genre grammatical dans une certaine mesure).

On peut aussi utiliser Wikidata:Lexicographical data/Documentation/Languages/fr pour documenter et suivre les lexèmes en français et la page de discussion correspondante pour discuter.

Hsarrazin (talkcontribs)

c'est sans doute moi (essentiellement, mais pas uniquement) qui ai ajouté "mot épicène" - si on se met d'accord sur une autre façon de faire, je ne demande pas mieux que de corriger '

Jsamwrites (talkcontribs)

@VIGNERON Il existe de nombreuses possibilités d'améliorer la couverture des lexèmes, rien qu'en se concentrant sur les professions et en les documentant. Je vois déjà environ 45 000 professions.

SELECT DISTINCT ?item ?label {
?item (wdt:P31/(wdt:P279*)) wd:Q12737077;
  rdfs:label ?label.
  FILTER (lang(?label)="fr")
Try it!

Il existe actuellement environ 400 lexèmes liés aux professions.

SELECT DISTINCT ?item ?sense ?lexeme ?lemma ?genre WHERE {
  ?lexeme rdf:type ontolex:LexicalEntry;
    dct:language wd:Q150;
    wikibase:lemma ?lemma;
    ontolex:sense ?sense.
  ?sense wdt:P5137 ?item.
  ?item (wdt:P31/(wdt:P279*)) wd:Q12737077.
}
ORDER BY (?item) (?lemma) (?genre)
Try it!

Je serai heureux de contribuer à l'amélioration des lexèmes existants ou à l'ajout de nouveaux lexèmes.

Personnellement, je n'utiliserai pas non plus mot épicène(3083701) avec genre grammatical(P5185). Je suggérerai plutôt mot épicène(3083701) avec nature de l'élément(P31).

VIGNERON (talkcontribs)

Oui, j'avais eu le même réflexe et j'ai exploré les 47538 valeurs de forme féminine du libellé(P2521). L'idée était de voir si on pouvait générer au moins semi-automatiquement certains lexèmes et cela ne sera pas facile.

Dans la liste des valeurs de forme féminine du libellé(P2521), j'ai remarqué plusieurs situations qui mérite attention :

  • des doublons externes : des éléments distincts qui ont le même nom au féminin et donc qui sont sans doute à mettre en sens séparés d'un même lexème (mais pas toujours, il faut voir les sources à la main, "ailière" est clairement un seul lexème quelque soit le sport considéré)
  • des doublons internes : plusieurs valeurs au féminin au sein d'un même élément (le maximum étant 4 sur cleric (Q2259532))
  • enfin des valeurs qui ne sont pas des lexèmes (par exemple "Administratrice en chef de la santé publique du Canada" sur Chief Public Health Officer of Canada (Q5096891) - avec en plus une faute de typographie - ou tout les "ambassadrice de XXX").
  • en bonus, je remarque qu'il y a peu de sources mais on trouve 33 fois Femme, j'écris ton nom... (Q26821243) et 32 fois feminization dictionary (Q26821958). La première est disponible en ligne donc on devrait pouvoir facilement s'en resservir pour avoir des lexèmes correctement sourcés. Je note tout de même que c'est le bazar dans ces références (le même document est indiqué de plusieurs façon très différentes :/ cf. https://w.wiki/4PKJ je vais commencer par faire un peu de ménage là-dedans)

Malgré tout, il y a une majorité de cas simples que l'on devrait pouvoir reprendre pour créer facilement des milliers de lexèmes.

Je suis évidemment preneur de toute remarque, question et l'aide est la bienvenue.

Jsamwrites (talkcontribs)

@VIGNERON C'est fait pour les mots épicènes.

SELECT DISTINCT ?lexeme ?lemma WHERE {
  ?lexeme rdf:type ontolex:LexicalEntry;
    dct:language wd:Q150;
    wikibase:lemma ?lemma;
    ontolex:sense ?sense;
    wdt:P31 wd:Q3083701.
}
Try it!

Environ 75 mots.

VIGNERON (talkcontribs)

Génial !

J'en ai profité pour corriger les genre grammatical(P5185) = mot épicène(Q3083701) de @Hsarrazin:, en les déplaçant vers nature de l'élément(P31) et en ajoutant les deux genres m/f en genre grammatical(P5185) le tout avec QuickStatements.

Je viens aussi de faire tout les noms communs finissant en -iste (après avoir vérifier et exclut qu'il n'y avait pas de pièges, j'en ai trouvé que deux : chirurgien-dentiste (L615977) et chirurgienne-dentiste (L615978)). Il faudrait faire les autres suffixes réputés épicènes (j'ai regardé -ogue et -aire mais il y a pas mal d'exceptions, il va falloir faire à la main, la requête : https://w.wiki/4PSj).

Ta requête donne maintenant 111 résultats.

Hsarrazin (talkcontribs)

oki... donc il faut mettre à la fois le masculin et le féminin, c'est bien ça ?

VIGNERON (talkcontribs)

Sans certitude à 100 % mais c'est ce qui me semble le plus logique, non ?

Hsarrazin (talkcontribs)

du moment que tout le monde est d'accord pour faire comme ça ;)

Jsamwrites (talkcontribs)
VIGNERON (talkcontribs)

Oui très bien.

On pourrait ajouter quelques informations (j'ai ajouté l'identifiant TLFi et la mention du dictionnaire de l'académie pour la forme masculine ; on pourrait aussi enregistrer la prononciation, etc.) mais l'essentiel est là (données de bases, sens et formes).

Reply to "Nom d'un concept"

Call for participation in the interview study with Wikidata editors

1
Kholoudsaa (talkcontribs)

Dear PAC2,

I hope you are doing good,

I am Kholoud, a researcher at King’s College London, and I work on a project as part of my PhD research that develops a personalized recommendation system to suggest Wikidata items for the editors based on their interests and preferences. I am collaborating on this project with Elena Simperl and Miaojing Shi.

I would love to talk with you to know about your current ways to choose the items you work on in Wikidata and understand the factors that might influence such a decision. Your cooperation will give us valuable insights into building a recommender system that can help improve your editing experience.  

Participation is completely voluntary. You have the option to withdraw at any time. Your data will be processed under the terms of UK data protection law (including the UK General Data Protection Regulation (UK GDPR) and the Data Protection Act 2018). The information and data that you provide will remain confidential; it will only be stored on the password-protected computer of the researchers. We will use the results anonymized to provide insights into the practices of the editors in item selection processes for editing and publish the results of the study to a research venue. If you decide to take part, we will ask you to sign a consent form, and you will be given a copy of this consent form to keep.

If you’re interested in participating and have 15-20 minutes to chat (I promise to keep the time!), please either contact me at [] or [] or use this form https://docs.google.com/forms/d/e/1FAIpQLSdmmFHaiB20nK14wrQJgfrA18PtmdagyeRib3xGtvzkdn3Lgw/viewform?usp=sf_link with your choice of the times that work for you.

I’ll follow up with you to figure out what method is the best way for us to connect.

Please contact me if you have any questions or require more information about this project.

Thank you for considering taking part in this research.

Regards

Reply to "Call for participation in the interview study with Wikidata editors"

Identifiant pour l'annuaire du service public

2
Nomen ad hoc (talkcontribs)

Hello,

bravo pour cette initiative, cependant je regrette de n'avoir pas eu connaissance de la discussion. Une suggestion donc : la prochaine fois que tu fais une proposition concernant un sujet français, je t'invite à ajouter le code "{{Ping project|France}}" avant ta signature ;). A +

PAC2 (talkcontribs)

Ok, c'est bien noté.

Reply to "Identifiant pour l'annuaire du service public"
Nomen ad hoc (talkcontribs)

Bonjour PAC2,

merci d'avoir créé un élément sur le Bastion social, mais si tu avais vérifié préalablement, tu aurais constaté que j'en avais déjà créé un. Je les fusionne donc. Bonne continuation.

Reply to "Doublon"
There are no older topics