Topic on User talk:Lucas Werkmeister

Jump to navigation Jump to search
Queryzo (talkcontribs)

Hallo Lucas,

das Deutsche Filminstitut ist an mich herangetreten und möchte Wikidata seine Filmdaten in Form eines Kerndatensets zur Verfügung stellen. Wie geht man hierbei am besten vor? Wikidata:Data donation habe ich mir bereits angesehen, ich denke es läuft auf einen Boteinsatz hinaus. Kennst du hierfür einen geeigneten Botbetreiber, der die vorhandenen Items mit den fehlenden Eigenschaften auffüllen bzw. abgeglichende Eigenschaften referenzieren kann? In einem zweiten Schritt wäre wohl auch die Erstellung 10.000er Items notwendig, siehe die beiden Mix'n'match-Kataloge 293 und 294. Theoretisch wäre es auch mit Open Refine möglich, aber das erscheint mir bei der Anzahl der Datensätze und der Vielzahl der zu importierten Daren zu aufwendig. Ich würde mich erstmal um den Datensatz kümmern, als Datenformat ist wohl TSV am geeignetsten, oder? @CennoxX, T.seppelt, Färber: Auch für euch zur Kenntnis.

@Queryzo: Wie sehen den solche Datensätze aus? Wenn z.B. "Film A" und dessen "Filmeditor B" beides neue Objekte sind, wird dann auch per Bot die Property:P1040 in dem Filmobjekt befüllt oder ist das nicht möglich? Oder wäre das nur möglich wenn erst alle Personen und danach die Filmobjekte erstellt werden? --~~~~

Queryzo (talkcontribs)

@Färber: Siehe den Kommentar unten von Lucas, du darfst gern einen eigenen Antwort-Abschnitt erstellen. :-) Zu deiner Frage: Ich stelle es mir so vor, dass erstmal die bestehenden Datensätze mit fehlenden Informationen aufgefüllt werden. Zukünftig sollen dann auch neue Objekte erstellt werden, woraufhin der erste Schritt wiederholt werden kann. Inwiefern ein Bot auch beide Schritte gleichzeitig machen kann, wird im weitern zu klären sein, das wäre natürlich wünschenswert.

Lucas Werkmeister (talkcontribs)

Hast du dir auch Wikidata:Dataset Imports angeschaut? Eine Unterseite davon für diesen Import wäre vermutlich sinnvoll, da können diese und andere Fragen dann zentral beantwortet werden. (Ich bin mir nicht ganz sicher, wie weit diese Seite mit Data donation integriert ist.)

Ich verstehe nicht ganz, was das Problem mit OpenRefine sein soll. Meinst du, es wäre zu aufwendig im Vergleich zur geringen Menge Daten, oder es gibt zu viele Daten um damit mit OpenRefine umzugehen, oder etwas noch anderes?

Mit den verschiedenen Botbetreibern kenne ich mich nicht so sehr aus. OpenRefine müsste aber auch in der Lage sein, die Daten zu importieren, und wo nötig auch neue Items anzulegen.

Färber: Verwende bitte die Antwortfunktion, den Post selbst zu editieren ist bei Structured Discussions wenig sinnvoll :)

Queryzo (talkcontribs)

Ja, solch eine Unterseite würde ich dann anlegen. Ich wollte aber erstmal vorfühlen, was hierfür das richtige Vorgehen ist. Open Refine finde ich bei mehreren 1.000 Datensätzen sehr umständlich. Der Datenabgleich ist langwierig und man verliert schnell den Überblick.

CennoxX (talkcontribs)

@Queryzo: Bin sehr interessiert an dem Datenimport, kannst mich gerne auf dem laufenden halten.

Queryzo (talkcontribs)
Queryzo (talkcontribs)

Hallo Lucas, wie bereits auf der Disk von CennoxX dargestellt, gibt es vom Filminstitut eine neuerliche Anfrage zur Datenspende eines Kernsets von Daten aus dem Filmportal. Ich hoffe, dass wir nun hier einen Schritt weiterkommen.

Reply to "Datenspende vom filmportal.de"