Ga naar inhoud

Methodiek

Introductie

De bezoekersanalyses in Digitwin geven inzicht in bezoek- en verplaatsingsgedrag binnen zelf gekozen locaties. De metingen worden uitgevoerd met geanonimiseerde locatiegegevens van mobiele devices. De uitkomsten zijn schattingen op basis van een steekproef, geen volledige tellingen. Dit hoofdstuk legt uit hoe de meetmethode werkt, waarom resultaten altijd met een bandbreedte moeten worden geïnterpreteerd en welke keuzes aan de basis staan van betrouwbare metingen.

Uitleg

De onderliggende methode werkt met een steekproef van devices (smartphones). Niet iedere aanwezige persoon levert een meetpunt op, maar een deel van de aanwezigen wordt wel waargenomen. Op basis van die steekproef worden uitkomsten berekend en opgeschaald tot een schatting voor de totale aanwezigheid in een locatie.

Daarom zijn uitkomsten altijd schattingen en geen absolute waarheid. Dit is vergelijkbaar met het verschil tussen een telling waarbij iedereen wordt geteld en een meting waarbij op basis van een representatief deel een totale uitkomst wordt geschat.

Datapunten en omstandigheden

De gemeten devices geven meestal geen continue datastroom, omdat dit de batterij te veel belast. Het is dus niet vergelijkbaar met de nauwkeurigheid van een actieve navigatie-app. Besturingssystemen (zoals Apple en Google) gebruiken verregaande methodes om batterijgebruik te beperken.

De hoeveelheid locatiepunten die beschikbaar komt is hierdoor van de omstandigheden afhankelijk. Enkele factoren die hierop invloed hebben:

  • Er wordt alleen data ontvangen van apps waarvan de gebruiker toestemming heeft gegeven om locatiegegevens te delen (opt-in).
  • Een device in beweging geeft meer datapunten dan een device in stilstand.
  • Een device met een actieve navigatie-app geeft meer datapunten dan een device waarop bijvoorbeeld nieuws wordt gelezen.
  • Een device dat op een bureau ligt of aan de lader hangt geeft minder datapunten dan een device in beweging (ook in een handtas of broekzak).
  • Een device waarvan het scherm aan is geeft meer datapunten dan een device dat op standby staat (display uit).
  • Een device in beweging geeft gemiddeld 1 locatie per kwartier, ook als het display niet aan is en het device in een handtas/broekzak zit.
  • Een device dat stil op een nachtkastje ligt kan urenlang geen enkele locatie melden.

Horizontale nauwkeurigheid

De gemeten locaties hebben bovendien een horizontale nauwkeurigheid die varieert van 10 meter tot wel 3 kilometer. Dit hangt af van de bron van de locatiebepaling, bijvoorbeeld of de locatie door GPS is gemeten.

Vanwege slechte GPS-ontvangst is de horizontale nauwkeurigheid van punten in een gebouw vaak veel lager. In de verwerking worden alleen GPS-locatiegegevens met hoge horizontale nauwkeurigheid gebruikt.

Betrouwbaarheid en meetperiode

De betrouwbaarheid van de resultaten hangt sterk samen met de hoeveelheid meetpunten. Hoe langer er wordt gemeten, hoe groter de steekproef wordt, omdat er meer devices in de langere tijdsperiode worden waargenomen. Daarmee worden uitkomsten stabieler.

Bij korte meetperiodes kan toeval een grotere rol spelen. Een drukke dag of een stille dag weegt dan relatief zwaar mee, waardoor de onzekerheid groter wordt.

Betrouwbaarheidsinterval

Er wordt gewerkt met een betrouwbaarheidsinterval en een betrouwbaarheidsniveau. Er wordt altijd gewerkt met een betrouwbaarheidsniveau van 90% en het bijbehorende interval kan per deelgebied verschillen. Een interval van +/- 15% betekent dat er voor 90% zekerheid is dat de aangegeven waarde binnen + of - 15% van de werkelijke waarde ligt. Als de steekproef kleiner wordt, wordt het interval breder, bijvoorbeeld +/- 30%.

Rekenvoorbeeld

Er wordt op een dag een aantal bezoekers geschat van 2.500 en de locatie heeft een interval van +/- 15%. Dit betekent dat in 90% van de gevallen het werkelijk aantal bezoekers tussen 2.125 en 2.875 ligt.

Meetgebied

Een locatie wordt gemeten binnen een vooraf ingetekend meetgebied. Dat meetgebied is een polygoon op de kaart. Alles wat binnen dat gebied gebeurt wordt meegenomen in de meting. Dat betekent dat niet alleen bezoekers worden meegeteld, maar ook bewoners, werknemers en passanten die het gebied kruisen op bijvoorbeeld de fiets of in de auto.

Intekenen is bepalend

Het intekenen van het meetgebied is bepalend voor de kwaliteit van de uitkomst. Een meetgebied dat te klein is levert vaak te weinig meetpunten op, waardoor de steekproef te klein wordt en de uitkomst minder betrouwbaar. Een meetgebied dat grote doorgaande wegen, spoorlijnen of andere niet relevante doorstroom bevat kan de uitkomsten vertekenen, omdat verkeer of passanten dan als aanwezigheid binnen het gebied wordt meegeteld.

Visit time-out

Er wordt een visit time-out gehanteerd om te bepalen wat als één bezoek wordt gezien. Deze visit time-out staat altijd ingesteld op één uur, omdat dit voor verreweg de meeste locaties het beste aansluit bij normaal bezoekgedrag.

Een device dat meerdere keren wordt waargenomen binnen de ingestelde time-out telt dan als één bezoek. Als de time-out verstreken is na een laatste bezoek en het device komt later terug, wordt dat als een nieuw bezoek gezien.

Aansluitende periodes

Er wordt alleen gemeten en gerapporteerd over aansluitende periodes. Dat betekent dat een meetperiode doorloopt zonder gaten. Losse periodes kunnen niet worden samengevoegd tot één doorlopende rapportage.

Groepering

Meetgebieden kunnen gegroepeerd worden in Digitwin onder een Hoofdgroep of Subgroep. Een hoofdgroep is bijvoorbeeld "Binnenstad Den Bosch" en een Subgroep "Spoorzone Zuid".

Datalevering

De levering van data kent een vaste vertraging. Dagelijkse data wordt standaard vijf dagen na de gemeten dag zichtbaar. De actuele dag is dus nog niet volledig beschikbaar in de rapportage.

Week- en maandoverzichten komen vijf dagen na het einde van de week of maand beschikbaar. Reden hiervoor is dat tijd nodig is voordat alle data van devices is verzameld en doorgestuurd. Een device kan ook data verzamelen zonder internet en deze later doorgeven zodra er weer een internetverbinding aanwezig is.

Historische data

Historische data kan worden geleverd vanaf 1 januari 2022. Historische data wordt maandelijks verwerkt. Verwerking vindt plaats op de vijfde van de nieuwe maand en de uitlevering volgt rond de tiende van de maand. Om historische data te kunnen verwerken moeten locaties uiterlijk op de eerste dag van de maand zijn aangeleverd.