woordenboek

Anscombe’s quartet

Een viertal datasets met nagenoeg dezelfde beschrijvende statistieken maar met erg verschillende data

Anscombe’s quartet

Dit viertal van datasets heeft nagenoeg dezelfde descriptieve statistieken terwijl de onderliggende data wel degelijk erg verschillend is. Dit is goed te zien wanner de data in een grafiek word weergegeven zoals hiernaast. Francis Anscombe heeft dit viertal datasets gebouwd om het belang aan te geven van het visualiseren van data alvorens deze wordt geanalyseerd. Je ziet dat enkele outliers en andere observaties veel effect kunnen hebben op de statistische eigenschappen.

Een voorbeeld van Anscombe’s quartet

Beeld je in dat je de eigenaar bent van een bedrijf dat printwerk levert en je wordt verteld dat de gemiddelde klant 500 posters laat drukken per order. Op basis van dit inzicht schaf je een machine aan die in een halve dag 500 posters kan drukken, dan kunnen ze de volgende dag worden bezorgd. Echter heb je niet goed naar de data gekeken en slechts de beschrijvende statistieken beschouwd. Hierdoor heb je gemist dat er eigenlijk 2 type klanten zijn. Klanten die hele kleine oplagen bestellen van zo’n 5 stuks per keer en klanten die juist hele grote oplagen bestellen van meer dan 1000 posters. Nu heb je een dure machine aangeschaft die eigenlijk te goed (en dus te duur) is voor de kleine bestellers maar niet goed genoeg is voor de grote bestellers. Een dure grap die voorkomen had kunnen worden als je bekend was geweest met de les die Anscombe te bieden had. 

Extra informatie over Anscombe’s quartet:

importance of data visualisation




Toffe artikelen die we vonden over Anscombe’s quartet:

Share by: