User:OlafJanssen/Sandbox
NDE Datastories, NTA, pseudoniemen[edit]
Datastory rondom auteurs (in de NTA) en hun pseudoniemen
Idee: Nederlandse auteurs met pseudoniemen die samenvallen (dan wel vrijwel identiek zijn, dan wel sterk overeenkomen) met (de 'echte' namen van) andere auteurs (of breder: personen)
Voorbeelden:
- Anne de Vries (Q286841) --> pseudonym (P742) --> J. Cats --> Jacob Cats (Q46151)
- Lou Lichtveld (Q436463) --> pseudonym (P742) --> Joost van den Vondel --> Joost van den Vondel (Q312673)
Opmerking hierbij: je kunt de MediaWiki API (bv API-matig zoeken/matchen van een pseudoniem van de ene persoon tegen de echte naam van een andere persoon) (vermoedelijk?) ook vanuit SPARQL aanspreken, zie
- https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries/examples/advanced#Filter_labels_using_EntitySearch_from_mwapi_service_to_provide_Full_Text_Search
- https://www.mediawiki.org/wiki/Wikidata_Query_Service/User_Manual/MWAPI#Examples
Beginnen vanuit Wikidata[edit]
Zoekvraag: geef me alle auteurs met een (of meer) NTA-id (P1006) die een pseudoniem hebben Voorbeelditem: Theun de Vries (Q2143934), Edgar du Perron (Q1284250) Je kunt dit op twee manieren benaderen:
- Via pseudonym (P742) SPARQL:
SELECT DISTINCT ?item ?item_label #?itemAltLabel
?pseudonym
#?ntaid
#?image
WHERE
{
?item p:P31/ps:P31 wd:Q5. #humans
?item wdt:P27 wd:Q29999. #Dutch
?item p:P1006/ps:P1006 ?ntaid. #authors
?item p:P742/ps:P742 ?pseudonym.
?item rdfs:label ?item_label filter (lang(?item_label) = "nl").
FILTER (STR(?pseudonym) != STR(?item_label)).
#OPTIONAL{?item wdt:P18 ?image.}
#?item p:P1006/p:P1006 [].
}
ORDER BY ?item_label
LIMIT 500
Proberen om pseudonymen te matchen met andere Q-items, maar dit werk nog niet
SELECT DISTINCT ?item ?itemLabel #?itemAltLabel
?pseudonym
?ntaid
?item2
?item3 ?item3Label ?item3Description
#?image
WHERE
{
?item p:P31/ps:P31 wd:Q5. #humans
?item wdt:P27 wd:Q29999. #Dutch
?item p:P1006/ps:P1006 ?ntaid. #authors
?item p:P742/ps:P742 ?pseudonym.
#FILTER (?itemLabel = ?pseudonym). # werkt niet
#OPTIONAL{?item wdt:P18 ?image.}
#?item p:P1006/p:P1006 [].
SERVICE wikibase:mwapi {
bd:serviceParam wikibase:endpoint "www.wikidata.org";
wikibase:api "EntitySearch";
mwapi:search ?pseudonym; # Search for things named "marja"
mwapi:language "nl".
?item2 wikibase:apiOutput mwapi:item
}
BIND(URI(CONCAT("http://www.wikidata.org/entity/", ?item2)) AS ?item3)
SERVICE wikibase:label { bd:serviceParam wikibase:language "nl,en" } .
}
ORDER BY ?itemLabel
LIMIT 100
NLse auteurs uit de NTA met pseudoniem(en) die een foto hebben[edit]
#NLse auteurs uit de NTA met pseudoniem(en) die een foto hebben
SELECT DISTINCT ?auteur ?auteurLabel ?geboortenaam
(GROUP_CONCAT(?pseudonym; SEPARATOR = "; ") AS ?pseudonyms)
?image
(GROUP_CONCAT(?ntaid; SEPARATOR = "; ") AS ?ntaids)
WHERE {
?auteur wdt:P31 wd:Q5; #mens
wdt:P27 wd:Q29999; #uit Koninkrijk NL
(wdt:P106/wdt:P279) wd:Q482980; # beroep=auteur
wdt:P742 ?pseudonym; #met pseudonym
wdt:P18 ?image; #met afbeelding
wdt:P1006 ?ntaid. #met NTA id
OPTIONAL {?auteur wdt:P1477 ?geboortenaam.} #geboortenaam
SERVICE wikibase:label { bd:serviceParam wikibase:language "nl,en". }
} GROUP BY ?auteur ?auteurLabel ?image ?geboortenaam
Beginnen vanuit de Anefo-collectie op Wikimedia Commons[edit]
Foto's uit de Anefo-collectie waarop mensen staan afgebeeld die een beschrijving in de NTA hebben[edit]
We verbinden hiermee de Anefo-collectie met de NTA (m.b.v. Wikidata en Commons)
Stappen in de SPARQL-query
- Vraag alle beelden uit deze collectie op
- waarop iets afgebeeld staat (P180 in de structured data).
- Geef me optioneel de Wikidata-labels, -descriptions en -aliases van de afgebeeld dingen, in het Engels
- Geef me het NTA-id + URL (P1006) van de afgebeelde mensen.
- Geef me optioneel de pseudoniemen (P742) en de geboortenamen (P1477) van deze mensen
- Vraag nu ook de publicaties (als hoofdauteur) van deze mensen op (uit de NBT)
Nog uitwerken[edit]
- In Wikidata zoeken naar Nederlandse personen met een NTA-id (P1006) en een portret (P18)
- zoeken naar pseudoniemen(in WD en/of de NTA)
- publicaties van of over deze personen in de NTA en DBNL
Filteren op TopXX van bekende schrijvers?? (https://nl.wikipedia.org/wiki/Lijst_van_pseudoniemen) --> haal hier de NLs schrijvers uit, en kijk of je dit mbv SPARQL in WD kan doen