Van experiment naar werking: verschil tussen versies
Geen bewerkingssamenvatting |
Geen bewerkingssamenvatting |
||
Regel 69: | Regel 69: | ||
= Poging | = Poging 2022 = | ||
== Ingest van Belgische gemeenten en steden == | == Ingest van Belgische gemeenten en steden == |
Versie van 6 feb 2023 09:36
Begin april hebben we het data model voor actoren en activiteiten min of meer op punt, gebaseerd op wat ervaring en enkele voorbeelden. Tijd om te testen of dit nu ook echt werkt. De eerste stap daarvoor is om enkele basics op punt te krijgen, bv. locatiedata. Maar daarna moeten we de "actors" invoeren. En dat vergt een combinatiestap uit de verschillende legacy databanken.
Poging 2023
- eerst de landen
- dan de gemeenten en steden
- dan de genres, disciplines > discipline
- instrumenten en functies uit dkb en mcv > rol
- person types uit dkb
- people uit dkb
- relatie people en person types
- relatie people en locatie
- relatie people en "discipline"
- identity types uit mcv
- aliassen uit mcv > als
- identities uit mcv
- relatie identities en identity types
- relatie identities en aliassen
- relatie identities en "discipline"
- relatie identities en locatie
- organisation types uit dkb
- organisations uit dkb
- relatie organisation en organisation type
- relatie organisation en location
- organisation types uit mcv
- organisations uit mcv
- relatie organisation en organisation type
- relatie organisation en location
- relatie organisation en "discipline"
- venues uit dkb
- relatie venue en organisatie
- relatie venue en locatie
- tentoonstellingen uit dkb
- relatie tentoonstelling en activiteits/tentoonstellingstype (solo, groep, beurs, ...)
- relatie tentoonstelling en people, met rol
- relatie tentoonstelling en organisation, met rol
- relatie tentoonstelling en locatie
- residenties uit dkb
- relatie residentie en activiteitstype (residentie)
- relatie tentoonstelling en people, met rol
- relatie tentoonstelling en organisation, met rol
- relatie tentoonstelling en locatie
- podiumproducties uit dkb
- relatie productie en activiteitstype (podiumproductie)
- relatie productie en people, met rol
- relatie productie en organisation, met rol
- relatie productie en "discipline"
- relatie productie en eerdere productie (herneming)
- (niet vergeten, leeftijdscategorie)
- voorstellingen uit dkb
- relatie voorstelling en activiteitstype (voorstelling)
- relatie voorstelling en venue
- relatie voorstelling en organisatie
- relatie voorstelling en productie
- phonogrammen uit dkb
- relatie phonogram en activiteitstype (opname)
- relatie phonogram en identities, met rol
- relatie phonogram met "discipline"
- releases uit dkb
- relatie release en activiteitstype (release)
- relatie release en phonogrammen
- relatie release en identities, met rol
- relatie release en organisations, met rol
- relatie release met "discipline"
- (niet vergeten, format > CD, vinyl, ...) > kan dan later ook "digitaal" zijn
Wat met beelden? > onderzoeken, advies Wat met digitale releases? > Erin steken Wat met de concerten? > Erin steken
Poging 2022
Ingest van Belgische gemeenten en steden
(maart 2022)
Op basis van ergens een lijst heb ik op 9 april 2022 belgische gemeenten en steden via quickstatements ingested. Daarbij moet er ergens iets fout gelopen zijn, want een aantal gemeenten zitten er dubbel in:
SELECT ?landLabel ?itemLabel (GROUP_CONCAT(?item) as ?itemURLs) (count(?itemLabel) as ?itemLabelCount) { ?item <http://osloddt.wiki.opencura.com/prop/direct/P1> <http://osloddt.wiki.opencura.com/entity/Q229>; <http://osloddt.wiki.opencura.com/prop/direct/P20> ?land. SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],nl,en" . } } GROUP BY ?landLabel ?itemLabel HAVING (count(?itemLabel) > 1)
Dit is dus een TODO om die waar nodig te mergen.
Ingest van gecombineerde personen, organisaties en venues
(april 2022)
Samenstellen van de lijst
Uit de legacy databanken
Uit havelovewilltravel
Quickstatements
Types van actoren om te checken
Kunsthogescholen
Cultuurcentra
Cultuurcentra hebben vaak namen die beginnen met CC of die het woord "cultuurcentrum" bevatten. Deze query kan die helpen vinden:
SELECT DISTINCT ?itemLabel (GROUP_CONCAT(?item) AS ?items) WHERE { ?item <http://osloddt.wiki.opencura.com/prop/direct/P1> ?type. ?item rdfs:label ?itemLabel . FILTER (CONTAINS(?itemLabel, "CC") || CONTAINS(?itemLabel, "Cultuurcentrum")) . SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],nl,en" . } } GROUP BY ?itemLabel
Daarnaast kunnen we ook "top down" vertrekken vanuit een lijst van cultuurcentra, bv. https://nl.wikipedia.org/wiki/Lijst_van_cultuurcentra_in_Vlaanderen of https://cult.be/netwerk
Promotiegaleries
Gesubsidieerde organisaties
Platenlabels
Personen en organisaties
Aliassen
Venues en organisaties
Ingest van activiteiten
(mei 2022)
Leggen van relaties
(juni 2022)
Dedupliceren en reconcilen
(juli 2022)