Topic on User talk:Susannaanas

Jump to navigation Jump to search
Apalsola (talkcontribs)

Hei! Ehtän lisää kohteisiin tietoja, jotka on siellä jo on. Esimerkiksi Oulujoen kirkkoa käsittelevään kohteeseen (Q13527891) olit lisännyt Oulun hallinnolliseksi yksiköksi kaksikin eri kertaa (https://www.wikidata.org/w/index.php?title=Q13527891&type=revision&diff=697968370&oldid=697843790 ja https://www.wikidata.org/w/index.php?title=Q13527891&type=revision&diff=950144989&oldid=949652563), vaikka kyseinen tieto oli siellä jo ennestään molemmilla kerroilla vieläpä tarkemmin ilmaistuna. Vastaavia tapauksia on paljon muitakin. Ystävällisin terveisin ~~~~

Susannaanas (talkcontribs)

Olen tekemässä isoja tuonteja ja tarkistan duplikaatit kun olen pidemmällä. OpenRefine, jota käytän, on kömpelö tarkenteita tarkistettaessa. On ongelma, että sinun muokkauksillasi ei ole lähteitä, sillä kun yhdistän väitteitä, lähteetön olisi se, joka pitäisi poistaa.

Apalsola (talkcontribs)
Susannaanas (talkcontribs)

Hei! Olen pahoillani useista virheistä, joita olen joko parhaani mukaan pyrkinyt välttämään ja joita kaikesta huolimatta on tullut. Osa tuplasti ilmoitetuista on johtunut käytetyn työkalun "ominaisuudesta", ja voin ne massana siivota, kun ehdin. Wiki Loves Monumentsia varten olen vielä siivoamassa Ahvenanmaan arkeologisia kohteita, niiden sijainteja Ahvenanmaan kylissä ja saarilla. Kohteita on yhteensä viitisentuhatta, ja siihen sisältyy valtavan paljon käsityötä.

Jälkimmäinen ongelma, eli päällekirjoitettu suomenkielinen nimi on työtapaturma. Onkohan niitä paljon? Yleensä katson, mikä kohteen nimi on ennestään ja lisään vain tarvittavia. Olen varmaan itse askarrellut tuon alkuperäisen viime vuonna.

Tässä tapauksessa on ollut tarkoitus tehdä uusi kohde kirkossa sijaitseville haudoille, mutta se on yhdistynyt itse kirkon kohteeseen.

Kiitos kun tuot näitä esille. Ehkä virheiden spottausta varten voisi olla sivukin, katsotaan. – ~~~~

Apalsola (talkcontribs)

Automaattityökaluja käyttäessä kannattaa ainakin pistokoeluonteisesti tarkastaa lopputuloksia.

Noita kuvausten ylikirjoittamisia on vastaan tullut jonkin verran:

  • Monissa kirkkorakennuksia käsittelevissä kohteissa olet korvannut kirkkorakennus-sanan kirkko-sanalla. Tämä ei toki ole hirveän suuri ongelma, mutta sinänsä kirkkorakennus on kuitenkin täsmällisempi ilmaisu, koska "kirkko" voi tarkoittaa myös organisaatiota (vrt. esim. Suomen evankelis-luterilainen kirkko).
  • Lisäksi monissa rautatieasemia koskevissa kohteissa olet korvannut kuvauksissa rautatieasema-sanan asemarakennus-sanalla. Tämä on minusta astetta pahempi ongelma, koska rautatieasema käsittää kuitenkin asemarakennuksen lisäksi myös ratapihan ja muun asemaan kuuluvan infrastruktuurin. Myös kohteisiin linkitetyt Wikipedia-artikkelit käsittelevät rautatieasemia juuri tästä näkökulmasta. Siksi kohdetta tai sen kuvausta ei pitäisi rajata pelkkään asemarakennukseen. Merkittäville asemarakennuksille voi tietysti luoda oman kohteensa, mitä työtä ilmeisesti olet paljon tehnytkin.

Duplikaattien osalta nykyinen hallinnollinen yksikkö on duplikaattina hyvin monessa kohteessa, jossa on ollut historiatieto (eli käytännössä kuntaliitosten aiheuttamat muutokset hallinnolliseen yksikköön) kuvattuna. Ilmeisesti käyttämäsi työkalu ei tällöin havaitse, että kyseinen kunta on merkitty jo kohteeseen ja merkitsee sen uudelleen.

Suomalaisia kansanedustajia koskevissa kohteissa on myös etunimiä duplikaatteina, joskaan en muista, onko yksikään sinun lisäämänäsi. Jos olet kuitenkin kansanedustajien tietoja päivittänyt, kannattaa ehkä tarkistaa näitä päivityksiä.

Lisäksi juuri äsken havaitsin tällaisen ongelman: olit lisännyt suomalaista järveä käsittelevään kohteeseen ilmeisestikin saman nimistä (ja mahdollisesti samalla paikallakin sijaitsevaa) seitaakoskevia tietoja: https://www.wikidata.org/w/index.php?title=Q24327400&type=revision&diff=975617361&oldid=965395573. Jos järvi ja seita tässä tapauksessa ovat yksikäsitteisesti täysin sama asia, tämä on varmaan OK, mutta noin yleensä olisi varmaan järkevää tehdä molemmille omat kohteensa.

Susannaanas (talkcontribs)

Molemmat ensinmainituista liittyvät siihen, että sekä kirkkoympäristöt että rautatieasemat ovat kokonaisuuksia, joille on viranomaisten listaama kohde sekä kokonaisuutensa että rakennuksena, usein vielä monessa rekisterissä. Näiden erottaminen tai yhtenä pitäminen on jonkinasteista alkemiaa :-D Jokaiselle pikkukaupungin kirkolle ei kannata tehdä kohdetta erikseen kirkkoympäristölle, kirkolle ylipäänsä ja vielä kirkkorakennukselle. Joten yhdistän tai erotan näitä, eli laitan eri laajuisten kohdetietojen tietoja joko yhteen ja samaan kohteeseen tai erillisiin jonkinlaisen näppituntuman pohjalta. Ikävimpiä ovat nämä vahingot, joissa huolella tehtyjä kuvauksia tulee kirjoitetuksi yli. En puolustele niiden tekemistä, vaan harmittelen sitä, että kaikesta tuijottamisesta huolimatta vienti ei mene nappiin.

Wikipedia-artikkelin rajauksen voi tarkistaa vain lukemalla jokaisen erikseen. Tosin mielestäni Wikipedia ei määrittele tarvetta Wikidata-kohteille, mutta niiden pitäisi toki viitata oikean laajuiseen kohteeseen. Sen toteuttaminen on massatyökaluilla hyvin hankalaa.

Järvet ovatkin sitten oma haasteensa Geonames-viennin jäljiltä. Viennin puuttuvien ja virheellisten tietojen takia joutuu tekemään valtavasti taustatyötä ja silti arvuuttelemaan tietoja yhdistäessä, ja siitä seuraa väistämättä virheitä. Olen vielä tämän Ahvenanmaan syövereissä ja toivottavasti ehdin siivota kirkot ja järvet lähiaikoina.

Vielä noista duplikaateista. Olen niissä luottanut siihen, että jos lisään arvon, joka on entuudestaan, se yhdistyy kohteeseen ja lisää vain uuden lähteen. Ilmeisesti pieni ero väitteessä tekee siitä uuden väitteen entisen lisäksi. Se on varmasti juurikin tuo tarkenne, joka ei minulla ole ollut näkyvissä OpenRefinessa. Tämä pitää ottaa jatkossa huomioon. Ylimääräisiä voi toki vapaasti poistaa, mutta kyllä minun on siivottava, mitä olen sotkenut.

Olet tehnyt valtavasti hienoa työtä!

Susanna

Susannaanas (talkcontribs)
Apalsola (talkcontribs)

Noin yleisesti Wikidata-kohteet ja niiden laajuus pitäisi minusta ajatella ensisijaisesti käyttötarkoituksen perusteella: esimerkiksi rautatieasema on rautatieliikenteeseen liittyvä paikka/kokonaisuus, jonka ensisijainen ja alkuperäinen tarkoitus on liikenteellinen. Esimerkiksi arkkitehtooniset ja kulttuurihistorialliset näkökannat – vaikka sinänsä tärkeitä ovatkin – ovat rautatieasemaa koskevassa Wikidata-kohteessa alisteisia liikenteelliselle tarkoitukselle ja siksi ne eivät saisi ensisijaisesti määritellä kohteen laajuutta. Tämä toimii minusta molempiin suuntiin: Niin kuin jo edellisessä kommentissani sanoin, pelkkä asemarakennus on minusta liian suppea rajaus, mutta toisaalta "rautatieympäristö" voi olla liian laaja. Siksi on minusta tärkeä, että rautatieasema-kohteiden laajuus ajatellaan nimenomaan tämän liikenteellisen merkityksen kannalta (ja myös nimi ja kuvaus valitaan tästä näkökulmasta) ja tarvittaessa sitten luodaan omat kohteensa asemarakennukselle ja rautatieympäristölle, joissa sitten arkkitehtuuri ja kulttuurihistoria voivat olla pääroolissa. Sama koskee toki monen muunkin tyyppisiä kohteita, mutta rautatieasema on melko hyvä esimerkki tästä.

Susannaanas (talkcontribs)

Käyttötarkoituksia on monia ja tämä on järkevä rajaus nimenomaan Wikipedia-artikkelia ajatellen. Jos halutaan vaikka kartta rakennuksista, on silloin eri rajaus järkevä, mutta tietokanta on sama.

Apalsola (talkcontribs)

Tarkoitin käyttötarkoituksella nimenomaan reaalimaailman kohteen, esimerkiksi rautatieaseman, käyttötarkoitusta, en rautatieasemaa käsittelevän Wikidata-kohteen käyttötarkoitusta. Siitä kai olemme samaa mieltä, että rautatieasemat on alun perin rakennettu nimenomaan rautatieliikennettä varten, ei kuluttuurihistoriallisiksi monumenteiksi. Siksi rautatieasemaa käsittelevän Wikidata-kohteenkin tulee ensisijaisesti ilmentää tätä reaalimaailman kohteen käyttötarkoitusta. Ja niin kuin aiemmin sanoin, merkittäville (asema)rakennuksille voidaan tietysti luoda omat Wikidata-kohteensa.

Lisäksi Wikidatan esittelyn mukaan "Wikidata on vapaa, yhteisesti muokattava, monikielinen, toissijainen tietokanta, johon kerätään rakenteista tietoa Wikipedian, Wikimedia Commonsin ja muiden Wikimedia-liikkeen projektien tukemiseen, ja kaikille maailmassa." Wikidatan ensisijainen tarkoitus on siis tuke Wikimedia-projekteja, mistä seuraa, että Wikipedia-artikkeliin hyvin sopiva rajaus on yleensä järkevä myös Wikidata-kohteelle.

Susannaanas (talkcontribs)

Ja minäkin tajusin vasta kontekstin, eli jos on vain yksi kohde asemalle, se ei olisi "asemarakennus" eikä "asemanseutu" vaan "rautatieasema". Olen siitä samaa mieltä.

Apalsola (talkcontribs)

Löytyi taas yksi kummallinen muokkaus: Gustaf Nyströmistä oli tullut "Gustaf Carl Gustaf Nyström". Mistähän tällainen nimi on peräisin? Suomenkielisen Wikipedian artikkelissa koko nimi on "Carl Gustaf Nyström", enkä kyllä ole kuullut, että kenelläkään olisi koskaan ollut kahta samaa etunimeä.

Apalsola (talkcontribs)
Susannaanas (talkcontribs)

Tekevälle sattuu. Pyrin myös korjaamaan ja kiitän tarkoista huomioista.

Susannaanas (talkcontribs)

Kirjoitinkin väärään kohtaan, tässä uudelleen.

Olen tekemässä isoja tuonteja ja tarkistan duplikaatit kun olen pidemmällä. OpenRefine, jota käytän, on kömpelö ja hidas tekemään sitä etukäteen. Suurin osa yhdistyy olemassaolevaan, paitsi ne joissa on eri tarkenteet.

Olin päättänyt käsin siivota Oulun ja Limingan tuonnin jälkeen. Joudun nyt tuomaan sen uudelleen, koska oletettavasti siinä katosi tietoa.

On ongelma, että sinun muokkauksillasi ei ole lähteitä, sillä kun yhdistän väitteitä, lähteetön olisi se, joka pitäisi poistaa. Korjasin Limingan (jätin tekemäsi lähteettömän esityksen oman lähteistettyni sijaan.)

Reply to "Duplikaattitiedot"