Topic on User talk:Lucas Werkmeister (WMDE)

Jump to navigation Jump to search
Hogü-456 (talkcontribs)

Hallo Lucas,

ist es möglich, die täglichen Dumps als CSV zu veröffentlichen. Ich habe im Project Chat nachgefragt ob es möglich ist, das Lesen dieser zu vereinfachen, da das Dateiformat nicht so vielen geläufig ist. Ist es außerdem möglich einen Dump einmal soweit aufzubereiten, dass daraus Listen zu bestimmten Themen erstellt werden, die dann heruntergeladen werden können. Beispielsweise eine Liste aller Gemälde oder aller Datenobjekte mit Bezug zu einem bestimmten Staat und kann hierbei Wikimedia Deutschland unterstützen und mir einen Dump auf einem Speichermedium, also einer Festplatte oder einem USB-Stick zur Verfügung stellen. In meiner Freizeit arbeite ich wie auch im Beruf viel mit Tabellenkalkulationsprogrammen und kann diese gut bedienen. Kennst du jemanden der sich mit Makros in LibreOffice Calc gut auskennt und mir hier helfen kann. Ich kenne mich damit nicht gut aus und denke, dass Makros in diesem Fall bei einer großen Datenmenge für das Atualisieren wichtig sind und es erheblich vereinfachen und würde gerne die Dumps soweit aufbereiten, dass es themenbezogene Listen gibt. In Visual Basic mache ich viel mit Makros in Excel. Ich bin der Meinung, dass man mit Bereitstellung des Dumps dem Ziel, des Teilens des Gesamten Freien Wissens für jeden näher kommt. Aktuell gibt es hier hohe Hürden und eien großen Gruppe von Menschen ist es nicht möglich die Daten für eigenen Zwecke im großen Stil, also themengebietsweise zu nutzen. Das will ich ändern und ich freue mich auf deine Antwort.

Lucas Werkmeister (WMDE) (talkcontribs)

Ich glaube, Ghurons Antwort im Project Chat trifft es ganz gut – um Listen zu bestimmten Themen zu erstellen, ist der Query Service am besten geeignet. Ich kann mir nicht vorstellen, wie ein CSV-Dump von ganz Wikidata aussehen sollte oder verwendet werden könnte.

Hogü-456 (talkcontribs)

Der QueryService ist begrenzt und wenn man weitergehende Auswertungen durchführen möchte, dann kommt man ohne Programmierkenntnisse aktuell nicht weiter. Angesichts des aktuellen Lags beim QueryService, denke ich wäre die Verfügungstellung eines Dumps eine Möglichkeit Last von den Servern zu nehmen, da man ohne Programmierkenntnisse die Abfragen nicht effizienter machen kann. Mein Vorschlag ist den Dump aufzuteilen und themengebietsweise die Daten zum Download zur Verfügung zu stellen. Beispielsweise die Daten zu allen Gemälden. Aus meiner Sicht wäre es ein Versuch wert.

Reply to "Dump als CSV"