Wikidata:Lexikographische Daten/Dokumentation

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Lexicographical data/Documentation and the translation is 100% complete.
Other languages:
Bahasa Indonesia • ‎Bahasa Melayu • ‎Deutsch • ‎English • ‎Esperanto • ‎Nederlands • ‎Türkçe • ‎asturianu • ‎català • ‎dansk • ‎español • ‎français • ‎polski • ‎Ελληνικά • ‎русский • ‎српски / srpski • ‎українська • ‎հայերեն • ‎العربية • ‎हिन्दी • ‎বাংলা • ‎中文 • ‎日本語 • ‎한국어

Overview

 

Documentation

 

Development

 

Tools

 

Support for Wiktionary

 

How to help

 

Lexemes

 

Discussion

 

Wikidata:Lexicographical data

Dies ist die zentrale Dokumentationsseite über lexikographische Daten in der Wikidata.

Siehe auch die technische Dokumentation der Erweiterung WikibaseLexeme.

Einleitung

Datenmodell

Visualisierung des Lexeme-Datenmodells

Das Datenmodell von WikibaseLexeme beschreibt die Struktur der Daten, die in Wikibase als "Lexeme" behandelt werden. Im folgenden Text findest Du eine Zusammenfassung. Für weitere Informationen siehe Extension:WikibaseLexeme/Data Model.

Ein Lexem ist ein lexikalisches Element einer Sprache, wie ein Wort, eine Phrase oder ein Präfix (siehe Lexem auf Wikipedia). Lexeme sind Entitäten im Sinne des Wikibase-Datenmodells. Ein Lexem wird unter Verwendung der folgenden Informationen beschrieben:

  • Eine ID. Lexeme haben IDs, die mit einem "L" beginnen, gefolgt von einer natürlichen Zahl in Dezimalschreibweise, z. B. L3746552. Diese IDs sind innerhalb des Repositorys, das das Lexeme verwaltet, eindeutig. Die ID kann mit dem concept-base-URI eines Repositorys kombiniert werden, um einen eindeutigen URI für das Lexem zu bilden.
  • Ein Lemma zur Verwendung als eine für den Menschen lesbare Darstellung des Lexems, z.B. "starten".
  • Die Sprache zu der das Lexem gehört. Diese wird dargestellt, als Link auf ein konkretes Datenobjekt, z.B. English (Q1860) für Englisch.
  • Die Lexikalische Kategorie, zu der das Lexem gehört. Diese wird dargestellt, als eine Link auf ein konkretes Datenobjekt, z. B. adjective (Q34698) für Adjektiv.
  • Eine Liste von Lexem-Aussagen, um Eigenschaften des Lexems zu beschreiben, die nicht spezifisch für eine Form oder eine Bedeutung sind (z.B. abgeleitet durch grammatikalisches Geschlecht oder eine syntaktische Funktion)
  • Eine Liste von Formen, normalerweise eine für jede relevante Kombination von grammatikalischen Merkmalen, wie 2. Person / Singular / Vergangenheitsform. Eine Form wird mit den folgenden Informationen beschrieben:
    • Eine ID. Formen haben IDs, die mit der ID des Lexems beginnen, zu dem sie gehören, gefolgt von einem Bindestrich ("-") und einem "F", gefolgt von einer natürlichen Zahl in Dezimalschreibweise: z.B. L3746552-F7
    • Eine Darstellung der Form als String.
    • Eine Liste grammatikalischer Merkmale, die definieren, für welche syntaktische Rolle die gegebene Form gilt. Durch Verweis auf ein konkretes Datenobjekt, z.B. participle (Q814722).
    • Eine Liste von Form-Aussagen, die die Form oder seine Beziehungen zu anderen Formen oder Datenobjekten weiter beschreiben (z.B. IPA transcription (P898), Aussprache-Audio, reimt sich mit, verwendet bis, verwendet in der Region)
  • Eine Liste von Bedeutungen, die die verschiedenen Bedeutungen des Lexems beschreiben (z. B. "Finanzinstitut" und "Rand eines Gewässers" für das englische Nomen bank). Eine Bedeutung wird unter Verwendung der folgenden Informationen beschrieben (nicht verfügbar in der Benutzeroberfläche von wikidata.org ab dem 24. Mai 2018):
    • Eine ID. Die Bedeutungen haben IDs, die mit der ID des Lexems beginnen, zu dem sie gehören, gefolgt von einem Bindestrich ("-") und einem "S", gefolgt von einer natürlichen Zahl in Dezimalschreibweise: z.B. L3746552-S4. Diese IDs sind innerhalb des Repositorys, das das Lexeme verwaltet, eindeutig. Die ID kann mit dem concept-base-URI eines Repositorys kombiniert werden, um einen eindeutigen URI für die Bedeutung zu bilden.
    • Eine Anmerkung, der eine Bedeutung in natürlicher Sprache definiert.
    • Eine Liste von Aussagen, die den Bedeutungen und seine Beziehungen zu Bedeutung und Datenobjekten weiter beschreiben (z. B. Übersetzung, Synonym, Antonym, Konnotation, Register, deutet an,evoziert).

Dieses Datenmodell wird um die Eigenschaften erweitert, die typischerweise für Lexeme-Aussagen, Form-Aussagen und Bedeutungs-Aussagen verwendet werden. Für aktuelle Vorschläge solcher Eigenschaften siehe Wikidata:Lexicographical data/Properties for an overview of these properties and Wikidata:Property proposal/Lexeme.

Beispiel-Lexem nach Sprache und Lexikonkategorie
verb noun pronoun adjective adverb preposition postposition conjunction interjection numeral determiner grammatical particle
Arabic ذهب كتاب انا جميل عادةً في لكن‎ (بس) يعني واحد هذا
English go book I beautiful usually in but oh one this
German wissen Zukunft ich ausgezeichnet querbeet in aber ach eins dieser
Korean 먹다 사람 괴롭다 함께 가만 고전적
Spanish ir libro yo hermoso normalmente en pero oh uno esto
French aller livre je beau toujours dans mais merci un ce
Pashto تلل کتاب زه ښکلی په خو یو
Persian رفتن کتاب من زیبا در را اما آخ یک این
Russian быть вода я хороший хорошо в - и всё три - не

In einigen Fällen oder Sprachen kann es mehrere Entitäten für verwandte Wörter geben, in anderen nur eine. Die folgende Tabelle gibt einen Überblick darüber, wie sie verknüpft werden können:


Ein oder mehrere Lexeme für Substantive?
Unterschied in1 Lexem2+ Lexeme
BedeutungHinzufügen mehrerer BedeutungenHinzufügen einer Bedeutung zum LexemVerknüpfung eines oder mehrerer mit einem homographischen LexemVerdoppelung der Form auf jedem
EtymologieHinzufügen der WortherkunftHinzufügen einer Wortherkunft zum LexemstammVerknüpfung eines oder mehrerer mit einem homographischen LexemVerdopple auf jedem die Form
GeschlechtHinzufügen des Geschlechts zu jeder BedeutungHinzufügen des Geschlechts zu jedem LexemstammVerknüpfung eines anderen/anderer mit einem homographischen LexemVerdoppelung der Form auf jedem
gemeinsam/einzelnHinzufügen verschiedener BedeutungenVerwendung der lexikalischen Kategorie "Substantiv"Hinzufügen einer auf das Lexem zutreffenden BedeutungVerknüpfung eines anderen/anderer mit einem homographischen LexemVerdoppelung der Form auf jedem
Groß-/KleinbuchstabenHinzufügen verschiedener FormenQualifizierung der Formen mit der zutreffenden BedeutungHinzufügen einer auf das Lexem zutreffenden BedeutungVerknüpfung eines anderen/andere mit einem homographischen LexemHinzufügen nur von anwendbaren Formen
Singular/PluralHinzufügen verschiedener FormenQualifizierung der Formen mit der zutreffenden BedeutungHinzufügen einer auf das Lexem zutreffenden Bedeutungwenn möglich, Verknüpfung mit anderem/(n) homographischen LexemHinzufügen nur von anwendbaren Formen
AusspracheHinzufügen von zwei gleichen FormenBestimmung der jeweiligen Bedeutung mit Hinzufügen der AusspracheHinzufügen von anwendbaren Bedeutungenwenn möglich, Verknüpfung mit anderem/(n) homographischen LexemHinzufügen der Form und der zutreffenden Aussprache
Formen/BuchstabierenHinzufügen mehrerer oder alternativer FormenBestimme die Form mit den entsprechenden BedeutungenHinzufügen entsprechender Bedeutungwenn möglich, Verknüpfung mit anderem/(n) homographischen LexemHinzufügen nur von anwendbaren Formen

Für eine bestimmte Sprache und ein bestimmtes Kriterium (erste Spalte) ist möglicherweise nur eines der beiden zutreffend.

Interface (Benutzeroberfläche)

Lexem

Screenshot der Lexem-Erstellungsseite

Erstelle ein neues Lexem

  1. Gehe zu Special:NewLexeme
  2. Geben Sie ein Lemma (Wörterbuchform eines Wortes) ein — Lemma
  3. Geben Sie die Sprache des Lexems ein, indem Sie den Namen der Sprache oder der Q-ID eingeben — Language of Lexeme
  4. Geben Sie in dem oben angezeigten Feld den Sprachcode des Lemmas ein — Spelling variant of the Lemma
  5. Geben Sie die lexikalische Kategorie ein, indem Sie ihren Namen oder die Q-ID eingeben (Beispiel: Verb, Substantiv, Adjektiv ...) — Lexical category
  6. Klicken Sie auf "Create"
  7. Das Lexem wird nun mit diesen grundlegenden Informationen erstellt, Sie können es dann weiter bearbeiten
Screenshot vom Kopf einer Lexem-Seite

Ein Lexem bearbeiten

  1. Klicken Sie auf den Bearbeiten-Button neben dem Lemma
  2. Bearbeiten Sie den Inhalt der verschiedenen Felder
    • Lemma
    • Sprachcode des Lemmas – Spelling variant
    • Sprache des Lexems – Language
    • Lexical category
  3. Klicke auf "publish"
Screenshot der Oberfläche zum Bearbeiten einer Aussage

Hinzufügen, Bearbeiten oder Löschen von Erklärungen eines Lexems

  1. Um eine Lexem-Erklärung hinzuzufügen, klicke auf "add statement".
  2. Gib eine Eigenschaft ein: Gib ihren Namen in das Eigenschaftsfeld ein (Beispiel: derived from) und wähle sie aus der Vorschlagsliste aus
  3. Gib einen Wert ein
  4. Genau wie bei Artikeln kannst Du Qualifier und Referenzen hinzufügen
  5. Speichere mit "publish"
  6. Um eine Erklärung zu bearbeiten, klicke auf "edit".
  7. Um eine Erklärung zu löschen, klicke auf "edit" und dann auf "remove".

Löschen eines Lexems

  1. Gehe zu WD:RFD

Nach Lexemen suchen

So kannst Du über Special: Search oder das Suchfeld auf einer beliebigen Seite nach Lexemen, Lemmas, Formularen oder Bedeutungen suchen:

  • Suche nach einem Lexem anhand seiner L-Nummer
    • durch Eingabe von "Lexeme:L123"
    • Gib "L123" ein und wähle den Lexem-Namensraum aus
  • Suche nach einem Lexem mit dem Namen seines Lemmas
    • durch Eingabe von "Lexeme:Sandbox"
    • indem Du "sandbox" eingibst und den Lexem-Namensraum auswählst
  • benutze die L Abkürzung: "L:L123" oder "L:Sandbox"
  • Suche nach einem Formular (z. B. "Lexeme: Mangeant") mit einer der oben beschriebenen Methoden

Beachte, dass der Selektor (Dropdown-Menü, das angezeigt wird, um Ergebnisse vorzuschlagen) noch nicht funktioniert. Wenn Du jedoch die Eingabetaste drückst oder nach der Eingabe Deines Stichworts suchst, kannst Du auf die Ergebnisse zugreifen.

Form

Form hinzufügen

Erstellen einer neuen Form

  1. Klicke im Abschnitt "Formulare" auf "add Form".
  2. Fülle die Darstellung aus - Representation (obligatorisch)
  3. Fülle den Sprachcode der Darstellung aus - Spelling variant (obligatorisch)
  4. Gib ein oder mehrere grammatikalische Merkmale ein, indem Du ihren Namen eingibst und sie in der Liste der Elemente auswählst - Grammatical features

Bearbeiten einer Form

  1. Klicke auf den "edit" Button neben der Darstellung
  2. Ändere den Inhalt in den Feldern
  3. Klicke auf "publish"

Löschen einer Form

  1. Klicke auf den "edit" Button neben der Darstellung
  2. Klicke auf "remove"

Bedeutung

Erstellen einer neuen Bedeutung

  1. Klicke im Abschnitt "Bedeutung" eines Lexems auf "add Sense".
  2. Gib einen Sprachcode ein (zum Beispiel: en, fr, zh) - Language
  3. Gib eine Anmerkung ein (sehr kurzer Ausdruck, der die Bedeutung definiert) - Gloss
  4. Du kannst neue Glossare hinzufügen, indem Du auf "add" klickst.
  5. Klicke auf "publish"
  6. Jetzt ist die Bedeutung erstellt, Du kannst Erklärungen hinzufügen

Eine Bedeutung bearbeiten

  1. Klicke auf den "edit" Button neben der Darstellung
  2. Ändere den Inhalt in den Feldern
  3. Klicke auf "publish"

Entfernen einer Bedeutung

  1. Klicke auf den "edit" Button neben der Bedeutung-ID
  2. Klicke auf "remove"

Funktionen

Siehe auch: Wikidata:Lexicographical data/Development

Was ist in der ersten Version enthalten

  • Neue Datentypen: Lexeme, Form
  • Hinzufügen, Bearbeiten, Löschen von Lexemen
  • Hinzufügen, Bearbeiten, Löschen von Formen
  • Hinzufügen, Bearbeiten, Löschen von Aussagen
  • Hinzufügen, Bearbeiten, Löschen von Qualifikatoren
  • Hinzufügen, Bearbeiten, Löschen von Referenzen
  • Verknüpfen mit einem Datenobjekt, aus einem Lexeme oder einer Form
  • Verknüpfen mit einem anderen Lexeme, aus einem Lexeme, einer Form oder einem Datenobjekt
  • Suche nach Inhalten im Suchfeld
  • grundlegende interne APIs (für die Benutzeroberfläche verwendet, sollten nicht verwendet werden)

Was zukünftig hinzugefügt wird

Nach kurz- zu langfristigen Plänen geordnet

  • Suche nach Inhalten mit Spezial:Suche ✓ Done
  • Anzeigen des Lemmas in den Versionsgeschichten, den letzten Änderungen und der Beobachtungsliste ✓ Done
  • Hinzufügen, Bearbeiten, Löschen von Bedeutungen (Bedeutungen werden in der ersten Version nicht berücksichtigt) ✓ Done
  • RDF-Unterstützung und Fähigkeit, die Daten auf query.wikidata.org abzufragen ✓ Done
  • Bessere API-Unterstützung
  • Automatische Generierung von Formen
  • Datenzugriff auf Clients (andere Wikimedia-Projekte)
  • Bearbeiten von Daten direkt aus Wiktionary

Siehe auch