User talk:M2k~dewiki

Jump to navigation Jump to search

About this board

talk

Previous discussion was archived at User talk:M2k~dewiki/Archive 1 on 2016-07-06.

Zblace (talkcontribs)

Sorry I am new to WikiData and could you please inform me what were the names of these two items of questioned notability that you deleted? Thank you very much!

M2k~dewiki (talkcontribs)

Hello @Zblace:

ネイ (talkcontribs)

Hi there - I see that you have been adding an incorrect Library of Congress authority ID "no0087284" to Q11624900 repeatedly. I have fixed it to "no00087284"; please do not overwrite it to the incorrect one, thank you very much.

Hannes Röst (talkcontribs)
M2k~dewiki (talkcontribs)
Hannes Röst (talkcontribs)

hmm das ist keine so einfache Sache, da muesstest du mal mit dem Autor sprechen: https://www.wikidata.org/wiki/User_talk:Pasleim

Was du machen koenntest im Moment ist "add Prefix" = "0" und dann mit regex suchen nach Werten welche die richtige Laenge haben. Oder sonst runterladen und dann mit Python/Excel bearbeiten? Gruss --Hannes Röst (talk) 19:26, 18 September 2020 (UTC)

M2k~dewiki (talkcontribs)

Hallo @Hannes Röst: normalerweise wird nur dann importiert, wenn keine Constraint violation vorliegt. Allerdings dürfte bis zu dieser Änderung im Juni 2020 auch IDs ohne führende Nullen zulässig gewesen sein, wodurch keine Constraint violation vorlag.


Nachdem nunmehr das Format in der Property eingeschränkt ist, wäre es künftig denkbar, über das Feld "add prefix" in mehreren Durchgängen (kein Prefix, eine "0", zwei Nullen "00", ...) zu importieren, wobei jeweils nur jene IDs tatsächlich importiert werden, die inklusive Präfix genau sechsstellig sind. So hatte ich das vor ein paar Jahren mit dem Massenimport der Parlaments-ID für Österreich gelöst.


Allerdings sind mittlerweile bereits viele Objekte (auch ohne Artikel) mit HLS ausgestattet, sodass ggf. neue Artikel in der de-WP "nur mehr" mit dem bereits bestehenden "HLS-Objekt" verbunden werden müssen (was bei mehreren hundert neuen Artikeln täglich und über 90 Millionen vorhandenen WD-Objekten schwierig genug ist, ohne dabei Dubletten zu generieren).

Hannes Röst (talkcontribs)

> Allerdings sind mittlerweile bereits viele Objekte (auch ohne Artikel) mit HLS ausgestattet, sodass ggf. neue Artikel in der de-WP "nur mehr" mit dem bereits bestehenden "HLS-Objekt" verbunden werden müssen.

das waere natuerlich optimal, wir sind unterdessen bei 31053 HLS identifiers in Wikidata von total ungefaehr 36349, also gut 85% da auf dem Weg. Ich habe kuerzlich alle Familiennamen import und bin nun an den Ortschaften dran.

Weiterhin ist das Problem mit dem import dass manchmal das Template benutzt wird um auf einen anderen Artikel zu linken (als Referenz) und nicht als identifier. Gruss --Hannes Röst (talk) 20:03, 18 September 2020 (UTC)

M2k~dewiki (talkcontribs)

Hallo @Hannes Röst: Referenzen werden von HarvestTemplates nicht importiert.

Hannes Röst (talkcontribs)
FordPrefect42 (talkcontribs)

Hallo M2k~dewiki, was soll denn dieser und dieser Unsinn? Wie wäre es mit einer minimalen Prüfung vorab, ob es sich tatsächlich um Dubletten handelt? Es gibt zwei Erftstadien, eines in Grevenbroich (bis 2019, jetzt Jupp-Breuer-Stadion) und eines in Euskirchen. Kannst du da bitte aufräumen? Danke --~~~~

Mike Peel (talkcontribs)
M2k~dewiki (talkcontribs)
Mike Peel (talkcontribs)
M2k~dewiki (talkcontribs)

Hello @Mike Peel: i am using this page to check for unconnected pages: User:M2k~dewiki/Tools/Create_Objects ("Mann" = men, "Frau" = women); PetScan also includes unconnected pages, that have been moved from the user namespace to the article namespace, which have been ignored by Pi bot in the past. The Petscan-Queries exclude unconnected pages from category https://de.wikipedia.org/wiki/Kategorie:Wikipedia:L%C3%B6schkandidat wich are articles in discussion for deletion (the object will then be created, after the discussion has been closed and the article is kept). The bot could also exclude articles in https://de.wikipedia.org/wiki/Kategorie:Wikipedia:Schnelll%C3%B6schen (articles marked for speed deletion).

Mike Peel (talkcontribs)

OK, that's going to take time to parse, I'll get back to you. Meanwhile, I've added dewp back to the hourly check of new pages.

M2k~dewiki (talkcontribs)

Hello @Mike Peel: an improved bot could also enrich objects like some examples on User:M2k~dewiki/Tools/Enrich_Objects (e.g. for harvesting GND, VIAF, LCCN, IMDB, ... and various other IDs) and to check for these IDs before creating a new object, since they should be unique.

Mike Peel (talkcontribs)

There is always more that can be done...

M2k~dewiki (talkcontribs)

Hello @Mike Peel: of course, just a suggestion... Thanks a lot!

Again Doublettes from German articles

11
Lantus (talkcontribs)

According to this talk with @Mike Peel: and you, there is obviously no change with your bot. I detected again a wrong Wikidata item in a new German article from you resp. your bot: Old item Q55859742, newly created as Q96999118. As I understod the above mentioned discussion, you'd wait for several days before creating new data items?! —Lantus 03:48, 6 July 2020 (UTC)

M2k~dewiki (talkcontribs)

Hallo @Lantus:

vielen Dank für das Zusammenführen von Karl von Ribbentrop mit Karl Barthold Siegmund von Ribbentrop. Beim Import der Normdaten über HarvestTools kommt es in einem solchen Fall zu einer "Unique constraint violation", sodass solche Dubletten zum Zeitpunkt des Importversuches ebenfalls zusammengeführt werden können.

Weitere mögliche Dubletten finden sich unter

(Aktualisierung von Zeit zu Zeit durch einen Bot) bzw. auf

(zum Zeitpunkt der SPARQL-Abfrage) über Suche nach "Unique value" und Ausführung einer der drei Abfragen: "SPARQL (every item)", "SPARQL (by value)", "SPARQL (new)".

Nachdem ich keinen Bot betreibe gab es diesbezüglich von meiner Seite auch keine Änderung.

Täglich werden in der deutschsprachigen Wikipedia rund 300 neue Artikel

pro Monat sind das rund 9.000 Artikel.

Dazu kommen noch

Oft finden sich mehrere tausend unverbundene Artikel, Kategorien, Navigationsleisten, etc. beispielsweise unter

Grundsätzliche Fragen diesbezüglich wären:

  • Wie, wann, wodurch bzw. durch wen sollen Wikidata-Objekte für diese Artikel, Kategorien, Vorlagen, Listen, Begriffsklärungen, mit bestehenden Objekten verbunden bzw. neu angelegt werden?
  • Wodurch kann sichergestellt werden, dass dabei keine Dubletten zu den bestehenden über 91 Millionen Objekten angelegt werden, insbesondere bei unterschiedlicher Sprache/Zeichensatz/Alphabet und/oder unterschiedlichen Namensvarianten (Personennamen, Filmtitel, Bezeichnungen für Denkmäler, geografische Objekte, etc.) innerhalb der selben Sprache?
  • Wer kann die Vorschläge implementieren bzw. regelmäßig ausführen?

Siehe dazu unter anderem auch:

Lantus (talkcontribs)

hmmm, Danke für Deine ausführliche Antwort, aber ich sehe nicht, wie wir das Problem grundsätzlich lösen können. Gibt es dazu an anderer Stelle (ausser den beiden letzten Benutzerdiskussionsseitenlinks, die du genannt hast) noch Diskussionen? —Lantus 10:30, 8 July 2020 (UTC)

M2k~dewiki (talkcontribs)

Hallo @Lantus:

mein Vorschlag wäre, die grundlegenden Probleme auf Wikidata:Forum (deutsch) und/oder Wikidata:Project_chat (englisch, nachdem das Problem teilweise alle Sprachversionen betrifft) anzusprechen.

Probleme und Fragenstellungen sind aus meiner Sicht unter anderem:

( * Wer kann die Vorschläge implementieren bzw. regelmäßig ausführen? )

  • Wie können wir mehr Benutzer aus den Sprach-Communities (z.B. de-WP) dazu bringen, sich zumindest um die Objekte zu den von ihnen erstellten Artikel zu kümmern, von ihnen neu erstellte Kategorien, Navigationsleisten, Commonscats, Artikel, usw. mit bestehenden Objekte zu verbinden oder neue Objekte anzulegen, zu überprüfen und zu pflegen? Der Hauptaufwand besteht aufgrund unterschiedlicher Bezeichnungen, Bedeutungen und Zeichensätze in verschiedenen Sprachen, darin, im Vorfeld der ohnehin notwendigen gründlichen Recherche für einen Artikel festzustellen, ob dieser bereits in anderen Sprachversionen, Datenbanken, Lexika, Projekten wie Wiki-Commons, Wikisource, ... besteht (und ggf. weitere Inhalte in anderen Sprachversionen, Wiki-Projekten (Commons, Wikisource, Voyage, ...) und/oder externen Datenbanken und Lexika dem Leser aber auch Autor zur Verfügung stehen würden. Diese weiteren Inhalte und/oder darin enthaltenen Quellen könnten ggf. auch für den eigenen Artikel verwendet werden). Der Zusatzaufwand, ein neues Objekt anzulegen oder mit einem bereits bestehenden Objekt zu verbinden ist dagegen eher vergleichsweise gering, wenn das jeder selbst macht, nicht jedoch, wenn das einige wenige für alle anderen machen.
  • Wie kann man das Akzeptanzproblem, das Wikidata in der deutschsprachigen Community teilweise hat (siehe beispielsweise Wikipedia:Umfragen/Normdaten_aus_Wikidata und Wikipedia:Meinungsbilder/Nutzung von Daten aus Wikidata im ANR), verringern, sodass sich mehr Benutzer aus der Sprach-Community beteiligen, sodass die deutschsprachige Wikidata-Community nicht nur aus einigen wenigen Benutzern besteht, die regelmäßig und laufend mitarbeiten. (Henne-Ei-Problem: "Die Datenqualität von Wikidata ist angeblich so schlecht, daher beteilige ich mich nicht. Weil sich so wenige beteiligen ist die Datenqualität schlechter als sie sein müsste, wenn sich mehr beteiligen würden.")
  • Wie kann man mehr Benutzern der deutschsprachigen Wikipedia den Nutzen von Wikidata näherbringen und die Aufmerksamkeit auch auf Wikidata lenken (beispielsweise bei Benutzern ohne Wikidata-Diskussionsseiten, die einen neuen Artikel einstellen, eine Begrüßungsseite auf Wikidata anlegen, im Bereich Film gibt es einen Bot in der de-WP, der bei fehlender Zuordnung zu einem WD-Objekt den Artikelersteller auf dessen de-Diskussionsseite über die fehlende Zuordnung benachrichtigt, usw.)
  • Denkbar wäre es auch, die Problematik in einem Beitrag im de:Wikipedia:Kurier anzusprechen.

Aus meiner persönlichen Sicht ist die Anlage von Dubletten auch bei noch so sorgfältiger Prüfung (weder automatisiert noch manuell, weil die Daten auch nicht immer vollständig und eindeutig sind und nicht alle möglichen unterschiedlichen Schreibweisen, IDs, unterschiedliche Sterbe- und Geburtsdaten bekannt und angegeben sind) nicht komplett verhinderbar. Mein Zugang wäre, vermeiden, so gut es geht, aber wenn es doch einmal zu er Dublette kommen sollte, so wird diese über Unique-Constraint-Violations über zahlreiche IDs (GND, VIAF, IMDb, uvam.) ausfindig gemacht und kann zusammengeführt werden.

Beispielsweise wurden unlängst 160.000 Datensätze angelegt, die aus dem Namen und der GND bestanden (und mittlerweile um Geburts- und Sterbejahr ergänzt wurden, sodass Pi Bot, der zuletzt deaktiviert wurde, sodass nunmehr noch mehr manueller Aufwand für einige wenige besteht, darauf basierend automatisch zu bestehenden Objekten zuordnen könnte). Nachdem die GND aber bei dem zweiten, bereits vorhandenen Objekt noch nicht vorhanden war, wurden zahlreiche Dubletten angelegt, die teilweise noch immer vorhanden sind (siehe auch User_talk:MrProperLawAndOrder#Mathilde_Welcker_(Q94753027)_and_Mathilde_Welcker_(Q94753026)_are_identical) Gerade wenn massenweise Datensätze aus verschiedenen Bibliotheken und Datenbanken eingespielt werden, können Dubletten nicht ausgeschlossen werden, wenn die Daten mit dem vorhandenen Datenbestand vorab nicht gründlich abgeglichen wurden.

Lantus (talkcontribs)

Wieder eine neue Doublette entdeckt: Q55124622 und Q97487670: Q97487670 wurde von Dir gestern Abend neu angelegt, obwohl Q55124622 bereits existierte und unter dem Namenseintrag dieser Person bereits verlinkt ist. Ich dachte wir hätten uns geeinigt, dass derartige Aktivitäten erst nach einer Woche erfolgen? —Lantus 06:26, 19 July 2020 (UTC)

M2k~dewiki (talkcontribs)

Hallo Lantus,

vielen Dank für das Zusammenführen von Jakob von Graviseth mit Jacob Gravisset. Weitere mögliche Dubletten sind beispielsweise unter

gelistet.

Bislang gab es aus meiner Sicht leider noch keinerlei Einigung bezüglich der Frage, wer, wann, wodurch die Objekte für unverbundene Artikel, Kategorien, Vorlagen, Listen, usw. angelegt werden sollen, inbesondere die Diskussion Wikidata:Forum#Wikidata-Objekte_für_noch_nicht_zugordnete_Artikel,_Kategorien,_Vorlagen,_Listen,_Begriffsklärungen,_mit_bestehenden_Objekten_verbinden_bzw._neu_anlegen ist derzeit noch offen. Mittlerweile dürfte der GZWDer-Bot die Aufgabe teilweise (wieder) übernommen haben, siehe auch User:GZWDer (flood)/Automatic creation schedule.

Lantus (talkcontribs)
M2k~dewiki (talkcontribs)
M2k~dewiki (talkcontribs)
M2k~dewiki (talkcontribs)

Hallo @Lantus: die Seite User:M2k~dewiki/Tools/Create Objects kann verwendet werden um Artikel ohne Wikidata-Objekt zu finden und ggf. mit bestehenden Objekten zu verbinden bzw. neue Objekte anzulegen. Vielen Dank für die Unterstützung!

Du warst leider schon wieder zu schnell (s. meine letzten Bearbeitungen bzgl. Kümmell). —Lantus 20:00, 12 September 2020 (UTC)

M2k~dewiki (talkcontribs)

Hallo @Lantus: vielen Dank für den Hinweis. Die Objekte Hermann Kümmell und Hermann Adolph Kümmell wurden zusammengeführt (de:Benutzer:M2k~dewiki/FAQ#Wikidata-Dubletten-zusammenfügen).

Verbesserungsvorschläge zur Anlage von neuen Objekten bzw. Verbindung von unverbundenen Objekten bitte unter

Unverbundene Objekte finden sich unter anderem auf

Tommes (talkcontribs)

Hallo M2k, ich denke, Du bist firm in Wikidata. Ich möchte gern wissen, wie ich eine Eigenschaft eines Items eintrage und mit einem Wert belege, dazu noch eine Quelle angebe. Konkret möchte ich die Höhenmeter einer Tour-de-France-Etappe eingeben können (Quelle: https://www.procyclingstats.com/race/tour-de-france/2020/stage-3/today/livestats).

Ich würde es "Altitude difference" nennen? In der EN-WP heißt es "Vertical metre" oder genauer "Cumulative elevation gain".

Ich möchte nicht, daß Du es für mich in Wikidata machst, sondern ich möchte verstehen, wie es strukturiert ist und eingetragen wird. Kannst Du mir das begleitend erklären?

Auf Deiner DE-Seite ist die Disk leer, daher schreibe ich hier :)

MfG

--~~~~

M2k~dewiki (talkcontribs)

Hallo @Tommes: ich sehe derzeit leider kein Property (Eigenschaft) mit dem man die Höhendifferenz erfassen kann. Unter Property talk:P3157 (Distanz eines Rennens oder einer anderen Veranstaltung, oder erreichte Distanz eines Ereignisses) unten (Wikidata-Eigenschaften mit Bezug zu Sport (Q349)) finde ich ebenfalls kein solches Property. Daher müsste eventuell unter Wikidata:Property proposal/Sports ein neues Property vorgeschlagen werden. Alternativ kann die Frage in größerer Runde auch in Wikidata:Forum (de) oder Wikidata:Project chat (en) gestellt werden, vielleicht hat jemand aus der Community eine andere Lösung, wie man die Höhendifferenz abbilden könnte.

M2k~dewiki (talkcontribs)

Hallo @Tommes: Das passende Property dürfte Property talk:P7297 (cumulative elevation gain) sein. ( Allfällige neue Properties müssten unter Wikidata:Property proposal (z.B. Wikidata:Property proposal/Sports, analog Property talk:P3157 / Wikidata:Property_proposal/event_distance) beantragt werden. ) Ein Item (=Wikidata-Objekt) kann nur als Wert (Value) für ein Property (Eigenschaft) verwendet werden (siehe auch die Grafik auf Wikidata:Introduction/de#Das_Wikidata_Repositorium). Derzeit gibt es rund 93 Millionen Items (Wikidata-Objekte, siehe Special:Statistics) und über 8.000 Properties/Eigenschaften. Items/Objekte sind durch eine ID aus Q + Nummer gekennzeichnet, Properties mit P + Nummer.


Siehe auch Wikidata:Forum#Höhenmeter (difflink)

Jkmoney320 (talkcontribs)

hello i see you mentioned me  for a request of deletion my my wikidata page  can i no the reason for this  sorry am i am new i was trying to add my clothing brand to the data base if i did something wrong can you help me fix it i mean no harm. if you please help me

M2k~dewiki (talkcontribs)
RuGus (talkcontribs)

Hallo und Danke für die Arbeiten an "Schiltern (bei Langenlois)"

Bin noch nicht so ganz firm in den Gepflogenheiten hier. Nachdem mein erster Artikel unter diesem User ohne mein Zutun recht flott gesichtet war, hätte ich wohl noch Fragen:

Im selben Stil wie Schiltern habe ich die Nachbar-Katastralgemeinde "Mittelberg (bei Langenlois)" vorbereitet. Wo kann ich da "schubsen", damit das auch in die offizielle Version übernommen wird? Ich habe versucht, meine Anfängerfehler aus dem ersten Artikel dort gleich zu korrigieren.


LG, ~~~~

M2k~dewiki (talkcontribs)

Thanks for welcome & newbie question

2
MFH (talkcontribs)

Thanks for the welcome message. I'm wikipedian since the first hour but new to wikidata. I like the idea and will try to contribute to my areas of expertise (science & math in particular). I asked a question at Talk:Q49008#circular defining formula and will also ask one about "set of prime numbers": There's written "opposite of: set of composite numbers". The mathematical meaning of "opposite" is additive inverse, so the opposite of the set of prime numbers is {-2, -3, ...}. Even if we consider "opposite" in the logical sense, it is incorrect that the opposite of "prime" is composite: e.g. the number 1 is neither prime nor composite. Similarly for zero and negative and all non integral numbers. Thanks in advance for any useful advice! ~~~~

M2k~dewiki (talkcontribs)