Wikidata talk:Lexicographical data/Sitelinks

From Wikidata
Jump to navigation Jump to search

Tool wanted for category interwiki maintenance[edit]

I, for one, greet our new centralization of interwiki links to Wikidata! Many of the categories in Wiktionary are "semantic categories", e.g. Category:Law that contains words and subcategories from legal terminology. Such a semantic category typically has subcategories for each language, e.g. Category:en:Law for English legal terms and Category:fr:Law for French legal terms, both in the English Wiktionary. If the English Category:Law is interwiki linked (through Wikidata) to French Catégorie:Droit (which might seem obvious, but isn't always), then the English subcategory Category:en:Law should also be interwiki linked to the French subcategory Catégorie:Lexique en anglais du droit. That is, the subcategory members on each side should be linked to corresponding subcategory members. Do we have any tools to check if this is the case, find the cases where it doesn't apply, or fix any inconsistencies, or is this all manual labour? As seen by this English-French example, the naming scheme isn't always so obvious (some sites use ISO language codes in category names, others use plain text; some sites treat Serbian and Croat as separate languages, others treat them as a single Serbocroatian language; some have separate categories for Business and Trading, others have only one category for Commerce). --LA2 (talk) 20:10, 3 August 2017 (UTC)

@Ivan A. Krestinin, LA2:. Now there is little problem, that not all categories from wiktionaries are imported - I imported only these with interwiki links. But not only thematic categories but also grammatical categories should be automatically recognized depending on name structure, with some exceptions (As I know, Czech and Slovak names of some categories for some langages without standardized declensions, but these two languages have ni thematic categorization.) JAn Dudík (talk) 11:55, 4 August 2017 (UTC)

Interwiki in CC0 or in CC BY-SA[edit]

Hi,

Based on Wikilegal/Lexicographical Data, I have some doubt on the possibility to have interwiki hosting for pages in Category, Wiktionary and Help namespaces. They may be considered as macrostructure and then be protected by CC BY-SA licence. The content of this pages for sure but also the inventory of pages is protected. Following this analysis, and as SA force to have reuses in the same licence, entries for this specifics sitelinks may have to be under CC BY-SA as well in Wikidata. What do you think of this? Noé (talk) 10:50, 11 March 2018 (UTC)

@Jrogers (WMF): can you tell us if categories are protected? Cdlt, VIGNERON (talk) 11:28, 11 March 2018 (UTC)
Hello,
We're not talking about the content of the pages or categories here, so it is not about the list of pages that are included in categories, only the URLs that link to it. From our prospective, a link linking to a list of pages containing content is not macrostructure, therefore it makes no sense to attribute a licence to these links.
@Noé: I'm wondering what you are trying to achieve here. What is your goal behind this question? Lea Lacroix (WMDE) (talk) 11:17, 12 March 2018 (UTC)
Ok, thank you for your answer. I am quite convinced. My goal is to explore every legal aspect, as the Wikilegal note is very preliminar. I want to have a better understanding of how licensing work because I think it is quite important for Wiktionaries contributors. We are still telling them their contributions are under CC BY-SA but some piece may finally ends up under CC0. I think it is a serious problem and we have to clearify what is protect and what is not. Noé (talk) 13:02, 12 March 2018 (UTC)

Je voudrais expliciter la préoccupation de User:Noé telle que je l'avais comprise (mais je me trompe peut-être), et cela en termes simples, même si je l'ai peut-être déjà expliqué. La liste des mots (nomenclature) d'un dictionnaire est, de façon générale, proégée par le droit d'auteur. On peut voir deux raisons à ça :

  1. la sélection des mots à inclure est un travail très important, et absolument fondamental pour le succès d'un dictionnaire. Un dictionnaire qui dirait qu'il reprend la nomenclature d'un dictionnaire en français mais en modifiant complètement le contenu autre que les mots eux-mêmes pourrait tout de même être condamné.
  2. beaucoup de lecteurs achètent un dictionnaire non pas principalement pour le contenu, mais pour la liste des mots. Ils peuvent avoir deux raisons :
    • ils s'en servent comme arbitre pour un jeu de lettres
    • ils s'en servent comme arbitre dans des discussions, pour savoir si un mot est français ou non (français, ou anglais, ou une autre langue). Ils ont tort de raisonner comme ça car aucun dictionnaire n'est complet, mais ils le font quand même très souvent.
    Ces deux raisons font que, si la nomenclature d'un dictionnaire peut être retrouvée ailleurs, sans avoir besoin d'acheter le dictionnaire, cela constitue une concurrence déloyale et un manque à gagner certain.

On peut estimer que les listes d'interwikis peuvent permettre de savoir quels mots sont présents ou absents des diverses versions linguistiques, et permettent donc de reconstituer leur nomenclature, qui perdrait ainsi sa protection.

Mais est-ce que cette protection sur la nomenclature peut s'appliquer aux wiktionnaires ? A mon avis non :

  1. la nomenclature n'est pas le résultat d'un travail de sélection, puisque l'objectif est d'inclure tous les mots ;
  2. un dictionnaire dont la nomenclature change tous les jours peut difficilement servir d'arbitre.

Par contre, pour le contenu des pages, le problème est tout différent, et Wikidata ne peut pas essayer de réutiliser quoi que ce soit (et n'y a de toute façon pas intérêt). Mais ça ne concerne plus les interwikis. Lmaltier (talk) 17:47, 24 April 2018 (UTC)

Je me rends compte que j'avais lu beaucoup trop vite, et que la question ne concernait pas les interwikis de l'espace principal. Je comprends mieux la réponse, et je suis également d'accord qu'il n'y a pas de problème. Lmaltier (talk) 17:52, 24 April 2018 (UTC)

Pas de souci @Lmaltier: et merci pour cette synthèse qui reste néanmoins intéressante pour comprendre la problématique. Mais en effet, et tant que la législation ne déclare pas qu'un lien doit être protégé de la même façon que le contenu vers lequel il pointe (saint Tim nous en garde, quoi que, avec les propositions qu'on a vu passer ces dernières années...), les liens vers les catégories ou les listes de mots pourront rester tranquillement dans le domaine public :) Lea Lacroix (WMDE) (talk) 06:41, 26 April 2018 (UTC)