User talk:Matěj Suchánek

Jump to navigation Jump to search

About this board

Archives of very old discussions are available:

78.102.193.92 (talkcontribs)

Ahoj, v datech Lilky Ročákové je nesprávně uvedeno, že je i herečka. Ve všech zdrojích na wiki stránce se o ní hovoří jako o zpěvačce, později pedagožce, ale nikde není uvedeno, že by byla herečkou. Jak můžu z wikidat tu chybu odstranit? Možná bys mohl tu chybu opravit sám, když slíbím, že další podobné nápady nemám v plánu :) , prosím. Děkuju za Tvůj čas a odpověď.

Matěj Suchánek (talkcontribs)

Ahoj, datová položka, odkazovaná z infoboxu nebo postranního panelu, je tady: Q12033537. Ten konkrétní údaj je tady: Q12033537#P106.

Údaj v roce 2015 přidal robot: Special:Diff/198646441. Předpokládám, že robot použil jako zdroj jednu z kategorií České herečky, České divadelní herečky nebo České filmové herečky, které jsou v článku doteď. Takže buď je chyba v obou (položce i článku), nebo to chyba není a je potřeba to upřesnit.

78.102.193.92 (talkcontribs)

Nevšimnul jsem si těch kategorií, zkusím to opravit. Moc díky.

Reply to "Lilka Ročáková"

Check Property talk:P214/Duplicates

5
Epìdosis (talkcontribs)

Hi! The Listeria-query in Property talk:P214/Duplicates seems not working anymore (ListeriaBot, when invoked, says "No items"). Could you check it? It was a very useful page! Thank you very much in advance!

Epìdosis (talkcontribs)
Epìdosis (talkcontribs)

Now fixed: the query went in timeout and in any case it seems that it is now impossible to show more than 8000 results in a page, so I've set a prudent LIMIT 7500. Now the bot seems working.

Epìdosis (talkcontribs)

Not so easy: the problem seems clearly connected to dimension, but LIMIT 7500 was ineffective; I tried with 5000 and 1000, nothing. So I created Property talk:P214/Duplicates/humans and using 500 it worked well. I leave LIMIT 7500 in the main list hoping it will work in the future. If you have suggestions, obviously they are welcome - so I leave this thread open :) Bye!

Matěj Suchánek (talkcontribs)

So is all working now? It might have been caused by timeout on the server side when generating the output (when loading labels for many items).

Preserve (kwalificatie) in Dutch tennis labels

11
Pommée (talkcontribs)

Re: your edit and many others like that.

Please don't remove essential bracket expressions from Dutch tennis labels.

Pommée (talk) 20:05, 24 September 2021 (UTC)

Matěj Suchánek (talkcontribs)
Pommée (talkcontribs)

They are not disambiguators but detailers. If you remove them, an item such as 2020 J&T Banka Ostrava Open (Q100347433) will show as its parts (has part (P527)) three identical names "WTA-toernooi van Ostrava 2020". A Dutch reader wishing to access one particular part (e.g. singles) will have to click them all to find the one that he wants. Readers in other languages will see their detailers. For example: English readers will see "– Singles" and German readers will see "/einzel". It is only fair that Dutch readers can see their particular detailer "(enkel)".

And how can I see a preview of this message before publishing it? Pommée (talk) 19:00, 28 September 2021 (UTC)

Pommée (talkcontribs)
Matěj Suchánek (talkcontribs)

Looks like we already had a discussion on this. I have just added kwalificatie to kept "detailers".

And how can I see a preview of this message before publishing it? You can switch between code and visual editor.

And why do multi-language items such as 2020 J&T Banka Ostrava Open (Q100347433) show up in English, although my defined wikidata language is Dutch? It seems Structured Discussions on Wikidata only support English.

Pommée (talkcontribs)

Thanks for your action and for your reply.

Yet: I cannot find a button (or whatever) to switch between code and visual editor. Pommée (talk) 15:25, 1 October 2021 (UTC)

Matěj Suchánek (talkcontribs)

It should be the pencil in the bottom-right corner of the input field.

Pommée (talkcontribs)

Thanks again for trying to help me. But I regret to report that I have no pencil there, or anywhere. Perhaps we should stop trying to sort it out. It is not important enough, compared to the time it consumes. Cheerio, Pommée (talk) 18:38, 2 October 2021 (UTC)

Matěj Suchánek (talkcontribs)

OK, whatever, it's off-topic anyway. Perhaps it's hidden somewhere in the preferences.

Pommée (talkcontribs)

Ref this one: preserve (rolstoelvrouwen).

Ref this one: preserve (rolstoelvrouwendubbel).

Matěj Suchánek (talkcontribs)

Done.

Reply to "Preserve (kwalificatie) in Dutch tennis labels"

Dates 00-00 vs 01-01

4
Summary by Epìdosis

MatSuBot still merges these duplicate claims; info added to phab:T310981

Epìdosis (talkcontribs)
Matěj Suchánek (talkcontribs)

Hi! Yes, the bot still does it (unless the SPARQL queries start to time out). It has no preferred format. It prefers claims with sources (this involves less write operations), otherwise the choice is incidental.

Epìdosis (talkcontribs)
Matěj Suchánek (talkcontribs)

Yes, only these two properties. But that's a parameter that I can change.

Reply to "Dates 00-00 vs 01-01"
Maundwiki (talkcontribs)

The description "Wikimedia disambiguation page" should not be merged into a non disambiguation page. For example {{Q|1661989}}. See also [[User talk:Pasleim]] Merge of objects. I assume your code also should be fixed. Maundwiki (talk) 22:42, 16 June 2021 (UTC)

Matěj Suchánek (talkcontribs)
Maundwiki (talkcontribs)

Thanks I did not look back that far. ~~~~

JAn Dudík (talkcontribs)

Ahoj, prosím potřeboval bych poradit query, které mi vypíše všechny small monument (Q3370053) v Czech Republic (Q213), které ale nemají uvedeno Q213. Moje pokusy padají nebo musím jet po mnohem menších územních celcích a dostanu všechny, s i bez.

A následně bych chtěl přes pywikibota nebo Quickstatements toto chybějící Q213 přidat - a opět poradit, jak na to.

Matěj Suchánek (talkcontribs)

Ahoj, v tuto chvíli se mi nepodařilo najít žádné. On ten tvůj požadavek není moc dobře formulovaný, protože po mně chceš dotazovat se po údaji, který v datech chybí (abys ho doplnil).

Mluvíš o celcích, takže pokud bychom na to šli tak, že památka má uvedený nadřazený celek (located in the administrative territorial entity (P131)), o kterém víme, že je v Česku, vypadalo by to takto:

SELECT ?item WHERE {
  ?item wdt:P31/wdt:P279* wd:Q3370053 .
  ?item wdt:P131/wdt:P17 wd:Q213 .
  FILTER NOT EXISTS { ?item wdt:P17 [] } .
Try it!

}

Je víc možností, jak to zapsat:

  • Místo FILTER NOT EXISTS jde i MINUS, ale jejich performance se liší (pokud to chápu správně, tak MINUS je množinový rozdíl, zatímco NOT EXISTS se vykonává jako samostatné dotazy).
  • Místo wdt:P131 by šlo wdt:P131+, ale tyhle rekurzivní dotazy jsou pomalejší a ta první úroveň obvykle stačí (předpokádám, že infrastrukturu ČR už máme na Wikidatech vyplněnou dobře).
  • Místo [] by šlo wd:Q213, protože takhle to vybírá položky bez jakéhokoliv státu. Ale případy, kdy je uvedený jiný stát než Česko, je lepší řešit manuálně.

Když pak máš výsledek, tak přijdou na řadu buď QS, nebo ten Pywikibot.

  • QS
    • je potřeba prostý text, kde řádky jsou ve formátu QXXX\tP17\tQ213 (QXXX je položka, co chci upravit, \t je znak tabulátoru, jde i |), a na každý řádek je jedna položka
    • položky lze získat třeba tak, že si výsledek dotazu stáhnu jako TSV nebo zkopírováním tabulky do schránky, vložím ho do textového editoru (Notepad++/gedit) a pomocí najít a nahradit ho očistím, aby zůstaly jen prosté identifikátory (případně jde použít Excel/Calc)
    • pak se to vloží do , pustí a je hotovo
  • Pywikibot
    • skript claimit.py -file:"soubor.txt" P17 Q213 -exists:p, kde soubor.txt obsahuje výsledek toho "čištění", které se dělá pro QS
    • skript claimit.py -sparql:"SELECT ?item { ... }", ale dotaz se musí vložit bez zalomení, což je méně praktické a nepřehledné (na Linuxu nebo v nějakém lepším shellu by šlo něco jako $ cat | tr '\n' ' ' | python3 pwb.py claimit ...)
JAn Dudík (talkcontribs)

Aha, @Vojtěch Dostál: to právě včera všude hromadně doplnil, takže asi proto se nic nenajde. Takže založím pár nových a vyzkouším potom, zatím díky.

Vojtěch Dostál (talkcontribs)

Používám k tomu tento Petscan


https://petscan.wmflabs.org/?language=cs&project=wikipedia&ns%5B0%5D=1&sparql=select%20%3Fmisto%20where%20%7B%0D%0A%20%20%3Fmisto%20wdt%3AP131%2B%20wd%3AQ213%20.%0D%0A%20%20MINUS%20%7B%3Fmisto%20wdt%3AP17%20%3Fstat%20.%20%7D%0D%0A%20%20MINUS%20%7B%3Fmisto%20wdt%3AP31%20wd%3AQ13406463%20.%20%7D%0D%0A%20%20%7D&common_wiki=wikidata&interface_language=en&active_tab=tab_other_sources&doit=&al_commands=P17%3AQ213

Akorát aby to fungovalo, je třeba v druhém řádku přidat hvězdičku (URL to neukládá):

  ?misto wdt:P131* wd:Q213 .

JAn Dudík (talkcontribs)

@Vojtěch Dostál, Matěj Suchánek: Tak jsem založil deset památek a oboje query včera vyzkoušel, Matějův dotaz mi najde 4 moje položky (dnes už pět) Vojtův 12 včetně mých deseti a dvou nepamátek. Japato? ;-)

Vojtěch Dostál (talkcontribs)

Matějův dotaz hledá jen památky které jsou skutečně podtřídou položky drobná památka (možná používáš nějaké instance které nejsou drobné památky v ontologii Wikidat?). Můj dotaz je obecný, hledá všechny položky které jsou v Česku dle P131.

JAn Dudík (talkcontribs)

@Vojtěch Dostál: Založil jsem 10 památek běžných typů. V Matějově výpisu vidím 2x kříž, 2x boží muka a 1x obrázek. V tvém je navíc sídliště, tvrz, 2 pomníky, 2 kaple a kaplička.

A v tom to asi bude, pomník ani kaple nemají nadtřídu drobná památka, kaplička ale ano (o úroveň výš).

Každopádně díky oběma, Petscan je pro mne uživatelsky příznivější a dostat z něj vstup pro pywikibota je jednoduché.

Vojtěch Dostál (talkcontribs)

Ahoj, tady zdá se tvůj bot přidal popisek "druh měkkýšů" ale jedná se o rod. Nevím zda je to systematický problém, třeba se ti ten batch podaří dopátrat a zkontrolovat :-). Dík

Vojtěch Dostál (talkcontribs)
Frettie (talkcontribs)

Jo, už jsem pro Jirku Sekereše opravoval nějaký cosi z týhle akce. Když to pak najdeš častěji, tak to asi jsem schopnej poměrně snadno opravit.

Vojtěch Dostál (talkcontribs)

Ono se obecně hrozně špatně s taxony pracuje, protože je jich několik milionů a nedají se moc queryovat :-) Jinak bych ti seznam chyb vyjel.

Frettie (talkcontribs)

Vojto, mně asi stačí typově najít "co je špatně" – tj. když mi hodíš změnu jak vejš, tak to najdu a překopu. Tedy snad. :)


A sem tam mi to připomínej. :)

Matěj Suchánek (talkcontribs)

Jak píšeš, Vojto, jenom jsem opravoval ten nesmysl "druh of..." a slepě jsem důvěřoval tomu, že je to fakticky správně.

Každopádně můžeme začít tímto dotazem. Většina z toho je "druh měkkýšů", ale ne všechno. Můžu je všechny hromadně změnit na "rod měkkýšů", ale tím bych podruhé vstoupil do stejné řeky a slepě důvěřoval...

Vojtěch Dostál (talkcontribs)

To vypadá dobře, Matěji. Určitě bych byl pro, abys to hromadně změnil. Kdyby se ti do toho opravdu nechtělo, napiš a udělám to já.

Vojtěch Dostál (talkcontribs)

Ještě jsem našel nějaké "rod of" čeledi - tam by bylo potřeba nahradit "rod of" na "čeleď": https://w.wiki/4coE

Matěj Suchánek (talkcontribs)
Infovarius (talkcontribs)
Matěj Suchánek (talkcontribs)
Takhirgeran Umar (talkcontribs)
Matěj Suchánek (talkcontribs)

It should be done.

Takhirgeran Umar (talkcontribs)

Helped. Thanks a lot!

Jura1 (talkcontribs)
Matěj Suchánek (talkcontribs)

It seems so.