Wikidata:Forum

From Wikidata
Jump to navigation Jump to search
Wikidata-Forum
Hier kann alles zu Wikidata besprochen werden: das Projekt, seine Regeln, technische Probleme usw.
Weitere Diskussionen und Ankündigungen gibt es insbesondere im englischsprachigen Project chat.
Auf dieser Seite werden alte Diskussionen nach 10 Tagen archiviert. Eine Übersicht aller Archive befindet sich hier. Das aktuelle Archiv befindet sich unter Wikidata:Forum/Archiv/2018/12.

Project
chat

Lexicographical
data

Administrators'
noticeboard

Development
team

Translators'
noticeboard

Request
a query

Requests
for deletions

Requests
for comment

Bot
requests

Requests
for permissions

Property
proposal

Properties
for deletion

Partnerships
and imports

Interwiki
conflicts

Bureaucrats'
noticeboard

ID herausfinden[edit]

Die Seite chessgames.com, zu der wir für Personen das Property:P1665 haben, hat zwei verschiedene Identifier: "Vorname_Nachname" und Zahlenfolgen. Letzere werden im Property verwendet, erstere lassen sich aber potentiell automatisch zuordnen (via Label). Die Frage wäre, ob man per Bot / Crawler ein beliebiges Spielerprofil (z.B. [1]) via "Vorname_Nachname" aufrufen und dann irgendwie auf die ID-Variante ([2]) gelangen kann. Dann könnte man die IDs in großer Zahl automatisch importieren. Steak (talk) 21:12, 27 November 2018 (UTC)

Ja könnte man versuchen, denn die ID steht vielfach im Quelltext drin. Hast Du eine Liste von Objekten, die Du durchtesten würdest? —MisterSynergy (talk) 21:40, 27 November 2018 (UTC)
Einfach die Ergebnisliste davon:
SELECT ?item ?itemLabel ?WHERE {
  ?item wdt:P106 wd:Q10873124 .

  MINUS {?item wdt:P1665 [] }.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }
}
Try it!
wobei man das englische Label nimmt und alle Leerzeichen durch Unterstriche ersetzt, um zu einem potentiellen Identifier zu gelangen (man müsste dann jeweils prüfen ob der Identifier gültig ist). Eventuelle Sonderzeichen und Diakritika müssten auch ersetzt werden. Soll ich die Liste vorbereiten und auf meiner Unterseite einfügen? Steak (talk) 08:41, 28 November 2018 (UTC)
Dafür braucht's keinen besonderen Bot: Wenn du die Namensliste hast, kannst du die IDs auch einfach selbst mit Google Docs ermitteln: Chessgames ID Extractor (Freigegeben zum Bearbeiten für jedermann) Aber wie du siehst, schlägt der Versuch schon bei Bobby Fischer fehl, weil der nur unter http://www.chessgames.com/player/robert_james_fischer.html zu erreichen ist. --Tkarcher (talk) 18:45, 28 November 2018 (UTC)
Versteh ich jetzt nicht: Was mach ich mit dem Google-Spreadsheet, wenn ich die Namensliste habe? Und Bobby Fischer ist mit ID unter http://www.chessgames.com/perl/chessplayer?pid=19233 zu finden. Steak (talk) 19:07, 28 November 2018 (UTC)
Du fügst die Namen in Spalte A ein und ziehst die übrigen berechneten Spalten entsprechend weiter nach unten. - - Tkarcher (talk) 19:12, 28 November 2018 (UTC)
Hab ich gemacht, allerdings geben die Felder keine Ergebnisse zurück. Steak (talk) 19:16, 28 November 2018 (UTC)
Du hast die Namen in Spalte B kopiert und die Formeln aus Spalte B, C usw. nicht kopiert, soweit ich das erkennen kann. (Bin gerade mit schlechter Mobilfunk-Verbindung unterwegs und kann daher kaum was erkennen, geschweige denn korrigieren) Tkarcher (talk) 19:24, 28 November 2018 (UTC)
Doch, die Befehle hab ich alle komplett nach unten gezogen. Aber eilt ja nicht, schaus dir einfach an wenn du wieder richtiges Internet hast ;) Steak (talk) 19:27, 28 November 2018 (UTC)
So, bin wieder zuhause. Und wie ich sehe, hat irgendjemand (ich war's nicht) die Spalten inzwischen korrigiert. Wird allerdings eine ganze Weile dauern, bis Google mit den 10.000 Einträgen durch ist. Außerdem sind dort einige dabei, bei denen nur die QID steht, und kein Name. Die hätte man vorher auch schon rausfiltern können... Na wie auch immer: Sag Bescheid, falls du hinterher noch Unterstützung beim Einfügen der Ergebnisse in Wikidata hast. Sollte aber recht einfach mit Quickstatements gehen. --Tkarcher (talk) 20:38, 28 November 2018 (UTC)
Ich hatte das selbst komplettiert. Aber mich hat irritiert dass dort "Loading" steht. Aber wenn das dauert bis es durchläuft macht das natürlich Sinn. Ich hab jetzt für den ersten Durchlauf gar nichts rausgefiltert. Bei weiteren Läufen mach ich dann das Feintuning. Steak (talk) 21:09, 28 November 2018 (UTC)

Uff, das Laden dauert länger als erwartet! Ich habe jetzt mal die ersten 500 durchsucht, und die gut 200 Treffer daraus gleich hochgeladen. Bei Namen mit Sonderzeichen muss die Formel zur Umwandlung noch verbessert werden: Ä, Ö und Ü tauscht sie schon aus gegen ae, oe und ue, aber viele andere Zeichen fehlen noch. --Tkarcher (talk) 23:33, 28 November 2018 (UTC)

Bitte aber sehr vorsichtig sein und möglichst jeden Treffer einzeln zumindest grob auf Korrektheit kontrollieren. Namensgleichheit bedeutet leider nicht in allen Fällen, dass das Item auch tatsächlich zur gesuchten Person gehört. Das Problem sehen wir leider in verschiedenen Bereichen, wo größere Mengen an an falschen Verknüpfungen zu Personen aufgrund von Namensgleichheit eingefügt wurden. --Kam Solusar (talk) 12:36, 29 November 2018 (UTC)
Klar. Deshalb sollte man ja möglichst viele Identifier haben, damit via Con-Vio Doppelungen etc. auffallen. Steak (talk) 12:57, 29 November 2018 (UTC)

Kurzer Zwischenstand: Ich habe inzwischen die komplette Spielerdatenbank aus chessgames.com in die Tabelle gezogen und damit die Abfrage erheblich erleichtert. Von den 10.000 Spielern ohne ChessgamesID konnte ich 2.500 in der Datenbank finden (siehe Lasche "Erledigt (gefunden)"). Ein paar Dutzend werden noch hinzukommen, wenn ich auch die letzten Sonderzeichen ersetzt habe, aber wesentlich mehr wohl nicht mehr. --Tkarcher (talk) 17:50, 29 November 2018 (UTC)

Danke für deine aktive Mithilfe. Bzgl. der kompletten Spielerliste: Ist die von hier? Dann ist das nicht die komplette Liste, sondern nur eine Liste mit den "most eminent" Spielern. Steak (talk) 17:58, 29 November 2018 (UTC)

@Tkarcher: Auf den Chessgames-Profilen gibt es bei lebenden Spielern immer einen Link zu FIDE-Karteikarte, der im Quelltext in der Form target="fide" href="http://ratings.fide.com/card.phtml?event=ID">FIDE player card enthalten ist, wobei "ID" eine Zahlenfolge ist. Wäre es möglich, dass du diese ID ausliest und mit den Werten von FIDE ID (P1440) vergleichst? So könnte man neue und auch schon länger bestehende Fehlzuordnungen ganz einfach finden. Steak (talk) 08:36, 5 December 2018 (UTC)

Grundsätzlich geht das, aber nach meinen schlechten Erfahrungen mit der importxml-Funktion (sehr langsam, sehr unzuverlässig bei mehr als 30-40 Aufrufen) überlege ich, ob man nicht lieber den direkten Kontakt mit chessgames.com suchen sollte: Aktuell haben wir insgesamt gut 15000 Einträge mit FIDE-ID und/oder Chessgames-ID:
SELECT ?item ?itemLabel ?Fide_ID ?Chessgames_ID WHERE {
  ?item wdt:P106 wd:Q10873124.
  OPTIONAL {?item wdt:P1440 ?Fide_ID} 
  OPTIONAL {?item wdt:P1665 ?Chessgames_ID}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}
Try it!
Vielleicht könnten wir diese Liste einfach an Chessgames schicken mit der Bitte um Abgleich mit ihrer Datenbank? Sollte für den dortigen Admin eine Sache von 5 Minuten sein, und könnte letztendlich die Qualität auf beiden Seiten verbessern: Chessgames könnte schließlich auch Profile mit fehlenden oder falschen FIDE-IDs haben... --Tkarcher (talk) 13:25, 5 December 2018 (UTC)
Wäre natürlich möglich, aber im Zweifel bekommt man einfach keine Antwort. Hast du schon versucht, diese importxml-Funktion mit Excel nachzubilden? Laut dieser Seite scheint das zu gehen. Und vielleicht ist Excel ja schneller? Steak (talk) 13:37, 5 December 2018 (UTC)
Oder doch ein Python-Skript mit 10 bis 20 Zeilen. Man könnte das mit einer Anfrage je 5 Sekunden innerhalb eines Tages hinbekommen. Die robots.txt der Seite lässt das zu. —MisterSynergy (talk) 13:53, 5 December 2018 (UTC)
Gerne auch das. Ich kann das dann zwar laufen lassen, aber leider nicht selbst schreiben. Steak (talk) 15:09, 5 December 2018 (UTC)
Code wäre hier. Den Code der beiden .ipynb-Dateien kannst Du kopieren und in lokale Python-Skripte speichern (Endung dann allerdings: .py). Die Textdatei "identifiers.txt" musst Du zeilenweise mit den zu crawlenden Identifikatoren füllen und im selben Ordner ablegen wie die .py-Dateien. Dann zuerst das Script "crawler.py" laufen lassen, bis es durch ist. Das legt einen neuen Unterordner an, in dem der Quelltext der Profile gespeichert wird; am besten zügig schauen, ob da überhaupt was gespeichert wird. Der Crawler kann jederzeit beendet und neu gestartet werden, dabei werden bereits geladene Profile nicht erneut geladen. Wenn alles da ist, mit dem "parser.py" schauen, was die Ausgabe ist: nur erfolgreich gefundene ID-ID-Paare werden aufgelistet; je nach Ausbeute kann der Parser recht einfach angepasst werden und erneut auf den lokal gespeicherten Profilkopien suchen. Disclaimer: chessgames kann bei der Aktion Deine IP-Adresse sehen. Ich habe das mit Python 3.7.1 unter Windows 7 getestet, mit der (ziemlich simplen) Python-eigenen IDLE-Umgebung. Falls Du Linux nutzt, müssen wir ggf. ein paar Kleinigkeiten anpassen. Bei Rückfragen gern auf meiner Benutzerdisk aufschlagen, damit wir hier nicht zuviel Geräusch machen müssen. Viele Grüße! —MisterSynergy (talk) 00:37, 7 December 2018 (UTC)
Danke, scheint zu funktionieren. :) Steak (talk) 15:12, 7 December 2018 (UTC)
Falls jemand so ein Skript schreibt, um aus dem HTML-Code die FIDE-ID zu extrahieren, könnte man das auch für 365chess und chesstempo verwenden, und ich vermute, dass man das auch außerhalb des Schachbereichs gebrauchen könnte. Eventuell gibt es so ein Skript sogar schon?! Steak (talk) 20:48, 5 December 2018 (UTC)

protected area authority ID[edit]

Wikidata:Property proposal/protected area authority ID Ich hätte gerne eine neue Property für Natur- und Landschaftsschutzgebiete in Bayern. Diese Nummern (Beispiel: LSG-00068.01 oder NSG-00019.01) werden vom Bavarian State Office for the Environment (Q812422) vergeben und dienen als Referenz. Sie sind ähnlich von WDPA ID (P809) die aber meist erst 1- 2 Jahre nach der Ausweisung der Schutzgebiete verfügbar sind. Ausserdem dienen die Nummern als Referenz in den Ausweisungstexten. Bitte unterstützen da ich im Moment die ganzen Gebiete auch hier in WD anlege. --Derzno (talk) 16:16, 3 December 2018 (UTC)

Danke für den Support von Bavarian protected area ID (P6230)

✓ OK --Derzno (talk) 07:25, 11 December 2018 (UTC)

male / female only parenting[edit]

I'd like to add a property in order to distinguish between single, male only or female only, and child rearing by both parents. There are many animal species where the male is the only parent (seahorses, cassowary, ...). Then there is the female does the parenting (tigers, elephants, ...). It would be great if we could add female/male, male/male, and female/female offspring care as well. Thoughts? --Hedwig in Washington (talk) 04:22, 5 December 2018 (UTC)

Was bin ich doch wieder fuer ein Schelm.... :-)) Rueberkopiert! --Hedwig in Washington (talk) 18:26, 7 December 2018 (UTC)

New Wikimedia password policy and requirements[edit]

CKoerner (WMF) (talk) 20:03, 6 December 2018 (UTC)

Identifier von Film über Filter mit API finden[edit]

Diese Abfrage hab ich hinbekommen:

SELECT ?Objekt WHERE {
  ?Objekt wdt:P345 ?imdbid
  FILTER (?imdbid = "tt0133093") .                    
  #SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
LIMIT 10

Try it!

Damit bekomme ich für eine IMDB-ID den Identifier des Films (hier: Matrix). Meine Frage: Wie kann ich mit der IMDB-ID den Identifier über die API herausbekommen. Das würde mich sehr interessieren. Geht sicherlich, aber ich hab bisher noch kein Beispiel gefunden. Mit dieser API-Abfrage bekomme ich alle Identifier die eine IMDB-ID besitzen, aber ich sehe den Wert nicht. Kann man das weiter filtern? Hätte ich den Identifier könnte ich mir über die API andere Werte: TMDB-ID für Martix per Skript holen. Danke für Hilfe.-- Stefan Kühn (talk) 16:37, 8 December 2018 (UTC)

Ich habe spontan keine Ahnung wie das übers API geht, aber ich weise mal auf die Funktion haswbstatement per einfacher Suche hin: haswbstatement:P345=tt0133093. Ich könnte mir vorstellen, dass Du das auch recht einfach übers API abgefragt bekommst. —MisterSynergy (talk) 20:24, 8 December 2018 (UTC)
Dank deinem Hinweis hab ich diese Abfrage gefunden. Sas hilf weiter. Danke. -- Stefan Kühn (talk) 20:43, 8 December 2018 (UTC)

Primärschlüssel[edit]

Bisher hab ich noch keine Info finden können zum Identifier, die mir sagt ob die Identifier auf ewig fest stehen? Also kann es passieren, dass "Q83495" in ein paar Jahren nicht mehr auf den Film The Matrix (Q83495) zeigt? Oder ist der Identifier eigentlich fix (außer irgendwer löscht was). -- Stefan Kühn (talk) 16:42, 8 December 2018 (UTC)

Der ist fix. Steak (talk) 18:22, 8 December 2018 (UTC)

Heiratsort[edit]

für historische Personen. Wie kann ich den am besten festlegen oder brauchen wir noch Eigenschaften, Qualifikatoren? Danke und Gruß--Oursana (talk) 20:34, 9 December 2018 (UTC)

Das Einzige, was mir dafür einfällt, wäre significant event (P793)  wedding (Q49836) / location (P276)Ort der Hochzeit. Vielleicht mit zusätzlichen Qualifikatoren P26 (P26) und point in time (P585). --Kam Solusar (talk) 12:01, 11 December 2018 (UTC)
ME müssen die Daten der Ehe unter dem jeweiligen Ehepartner vermerkt werden. Hochzeit ist im Idealfall der Beginn der Ehe belegt mit (Tages-) Datum und Ort.--Kresspahl (talk) 14:12, 11 December 2018 (UTC)

Reihenfolge von Qualifikatoren[edit]

Wie kann man die Reihenfolge festlegen, in der Qualifikatoren angezeigt werden. Ich habe die Amtszeiten der Mitglieder des deutschen Reichstages des deutschen Kaiserreiches mit quickstatements ergänzt und das mach ich getrennt nach Wahlperiode. Nun ist es so, dass manche in mehreren Perioden Mitglied waren. Hier ein Beispiel Q2283872. Hier stehen erst die zwei Startzeitpunkte, dann die Endzeitpunkte und dann die Legislaturperiode. Wie kann man die Reihenfolge ändern. Denn so ist es schlecht lesbar. -- Hogü-456 (talk) 20:41, 11 December 2018 (UTC)

Ich habe das passend geändert. Du brauchst den Hauptwert zweimal, mit den jeweils entsprechenden Start- und Enddaten sowie der Legislaturperiode. Die Reihenfolge von Qualifikatoren hat ausdrücklich keine Bedeutung, deshalb kann man sie auch nicht in „die richtige Reihenfolge“ bringen. —MisterSynergy (talk) 20:45, 11 December 2018 (UTC)

Freiwillige Feuerwehr Beselich-Obertiefenbach[edit]

Hallo zusammen,

es gibt Freiwillige Feuerwehr Beselich-Obertiefenbach bei Wiki de und auch als Cat bei Commons. Bitte mal schauen, ob diese zusammengeführt sind.--Woelle ffm (talk) 15:04, 12 December 2018 (UTC)

m.E. alles ok. In commons kannst du aber den Artikeltext löschen. Der ist auch in der InfoBox. --Derzno (talk) 19:06, 12 December 2018 (UTC)