Uitdagingen van een groeiende UiTdatabank

De UiTdatabank groeit jaar na jaar, met 2023 als absoluut recordjaar. 23 662 invoerders voerden meer dan 235 000 activiteiten in. Die hoeveelheid aan data en datastromen brengt ook uitdagingen met zich mee, zoals het voorkomen en opkuisen van dubbels.

Hoog op ons verlanglijstje - en dat van vele partners - stond de opkuis van dubbele locaties. Die dubbele locaties waren een struikelblok voor invoerders en integratoren die bij het selecteren van een locatie voor een evenement vaak meerdere keuzes hadden. Een deel van de dubbels vond ook zijn weg naar platformen zoals UiTinVlaanderen en andere UiTagenda’s. Daar is nu verandering in gekomen!

Maar waarom zaten er zoveel dubbele locaties in UiTdatabank?

Invoerders vergissen zich af en toe, ondanks de vele systemen die we al hebben om dit te voorkomen. Daarnaast kunnen honderden applicaties data vanuit hun eigen systeem naar de UiTdatabank exporteren – in de code sluipen soms bugs die resulteren in het onbedoeld aanmaken van dubbels.

Hoe pakten we dit aan?

Om van deze dubbele locaties af te raken, ontwikkelden we een slim algoritme. Dit algoritme analyseert locaties op basis van hun naam, adres en/of geocoördinaten en groepeert locaties die sterk op elkaar lijken in clusters. Deze clusters kunnen bestaan uit verschillende varianten van dezelfde locatie, zoals "Stedelijk Museum voor Actuele Kunst" en "S.M.A.K."

Voor elke cluster bepalen we een hoofdlocatie, oftewel de juiste of gewenste locatie die we willen behouden, en wat de ‘duplicates’ zijn die verwijderd moeten worden. Bij het opschonen van de dubbele locaties zorgen we ervoor dat de duplicates worden gelinkt aan de hoofdlocaties, waardoor de duplicates niet meer standaard vindbaar zijn in UiTdatabank.

Hierdoor kunnen invoerders deze dubbels niet meer selecteren tijdens het invoeren van locaties, en zijn ze niet meer vindbaar op UiTinVlaanderen of andere UiTagenda's. Bovendien worden de evenementen van de duplicates overgebracht naar de hoofdlocatie.

55590 locaties ontdubbeld

Dankzij deze automatische opkuis hebben we maar liefst 55590 locaties ‘opgeruimd’, wat neerkomt op 28% van alle locaties in UiTdatabank.

Die grote opkuis is niet alles

Het opkuis-algoritme loopt vanaf nu op gezette tijden en zal ervoor zorgen dat UiTdatabank zo vrij mogelijk blijft van dubbels.

Daarnaast zorgen we er zowel via onze gebruikersinterface op www.uitdatabank.be als in onze API voor dat de aanmaak van identieke locaties niet meer mogelijk zal zijn vanaf 1 juni 2024. Dit geeft partners die met de API integreren de kans om hun systemen aan te passen.

Daarnaast hebben we een tijdje terug het invoerscherm van UiTdatabank al gebruikersvriendelijker gemaakt, zodat invoerders gemakkelijker locaties kunnen hergebruiken. Zo worden de laatste vier gebruikte locaties voor elke invoerder klaargezet bij het invoeren.

Heb je toch nog een dubbel gespot? Of heb je vragen over dit dashboard? Laat het ons weten via vragen@uitdatabank.be

Begeleiding op maat

Meer publiek met de UiTdatabank

Een introductie tot publiekscommunicatie op maat van lokale organisatoren en verenigingen en een toegepaste uitleg over het gebruik van de UiTdatabank.

Meer lezen

Nieuw in de UiTdatabank

22 apr 2024

We werken het hele jaar door aan UiTdatabank zodat het voor jou nog makkelijker wordt om jouw publiek goed te informeren. Hier vind je de laatste updates en hoe jij ermee aan de slag kan!

Meer lezen

UiTdatabank

Het fundament van een platform voor vrijetijdsactiviteiten

Meer weten