Van experiment naar werking: verschil tussen versies
Geen bewerkingssamenvatting |
Geen bewerkingssamenvatting |
||
Regel 2: | Regel 2: | ||
== Ingest van Belgische gemeenten en steden == | == Ingest van Belgische gemeenten en steden == | ||
(maart 2022) | |||
Op basis van ergens een lijst heb ik op 9 april 2022 belgische gemeenten en steden via quickstatements ingested. Daarbij moet er ergens iets fout gelopen zijn, want een aantal gemeenten zitten er dubbel in: | Op basis van ergens een lijst heb ik op 9 april 2022 belgische gemeenten en steden via quickstatements ingested. Daarbij moet er ergens iets fout gelopen zijn, want een aantal gemeenten zitten er dubbel in: | ||
Regel 16: | Regel 18: | ||
== Ingest van gecombineerde personen, organisaties en venues == | == Ingest van gecombineerde personen, organisaties en venues == | ||
(april 2022) | |||
=== Samenstellen van de lijst === | === Samenstellen van de lijst === | ||
Regel 24: | Regel 28: | ||
=== Quickstatements === | === Quickstatements === | ||
==== Kunsthogescholen ==== | ==== Kunsthogescholen ==== | ||
Regel 53: | Regel 53: | ||
== Ingest van activiteiten == | == Ingest van activiteiten == | ||
(mei 2022) | |||
== Leggen van relaties == | |||
(juni 2022) | |||
== Dedupliceren en reconcilen == | |||
(juli 2022) |
Versie van 11 apr 2022 09:30
Begin april hebben we het data model voor actoren en activiteiten min of meer op punt, gebaseerd op wat ervaring en enkele voorbeelden. Tijd om te testen of dit nu ook echt werkt. De eerste stap daarvoor is om enkele basics op punt te krijgen, bv. locatiedata. Maar daarna moeten we de "actors" invoeren. En dat vergt een combinatiestap uit de verschillende legacy databanken.
Ingest van Belgische gemeenten en steden
(maart 2022)
Op basis van ergens een lijst heb ik op 9 april 2022 belgische gemeenten en steden via quickstatements ingested. Daarbij moet er ergens iets fout gelopen zijn, want een aantal gemeenten zitten er dubbel in:
SELECT ?landLabel ?itemLabel (GROUP_CONCAT(?item) as ?itemURLs) (count(?itemLabel) as ?itemLabelCount) { ?item <http://osloddt.wiki.opencura.com/prop/direct/P1> <http://osloddt.wiki.opencura.com/entity/Q229>; <http://osloddt.wiki.opencura.com/prop/direct/P20> ?land. SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],nl,en" . } } GROUP BY ?landLabel ?itemLabel HAVING (count(?itemLabel) > 1)
Dit is dus een TODO om die waar nodig te mergen.
Ingest van gecombineerde personen, organisaties en venues
(april 2022)
Samenstellen van de lijst
Uit de legacy databanken
Uit havelovewilltravel
Quickstatements
Kunsthogescholen
Cultuurcentra
Cultuurcentra hebben vaak namen die beginnen met CC of die het woord "cultuurcentrum" bevatten. Deze query kan die helpen vinden:
SELECT DISTINCT ?itemLabel (GROUP_CONCAT(?item) AS ?items) WHERE { ?item <http://osloddt.wiki.opencura.com/prop/direct/P1> ?type. ?item rdfs:label ?itemLabel . FILTER (CONTAINS(?itemLabel, "CC") || CONTAINS(?itemLabel, "Cultuurcentrum")) . SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],nl,en" . } } GROUP BY ?itemLabel
Daarnaast kunnen we ook "top down" vertrekken vanuit een lijst van cultuurcentra, bv. https://nl.wikipedia.org/wiki/Lijst_van_cultuurcentra_in_Vlaanderen of https://cult.be/netwerk
Personen en organisaties
Aliassen
Venues en organisaties
Ingest van activiteiten
(mei 2022)
Leggen van relaties
(juni 2022)
Dedupliceren en reconcilen
(juli 2022)