We zijn allemaal ooit de jongste mens op aarde geweest. Maar na zo’n kwartseconde waren we de titel van ‘jongste mens ter wereld’ naar verwachting alweer kwijt. Niemand die verder nog wakker ligt van dergelijke records. Anders is dat wanneer de oudste Belg/mens/man/vrouw/… komt te overlijden. Vorige week stonden de kranten er alweer vol van.
Via De Standaard vernamen we het trieste nieuws dat de oudste Belgische vrouw overleden is op 110 jarige leeftijd. Via Knack werden we verder ook nog ingelicht dat per toeval in dezelfde week ook de oudste vrouw ter wereld overleden is op 116 jarige leeftijd. Uit het artikel leren we ook nog dat deze laatste slechts 6 dagen de titel van oudste vrouw ter wereld gedragen heeft nadat op 1 april jl. een 117 jarige Japanse het leven liet.
Het verbaast me telkens hierover nieuwsberichten te lezen in onze (kwaliteits)media. Immers, per definitie is de oudste mens ter wereld erg oud en is de kans bijgevolg erg groot dat deze persoon over korte tijd zal overlijden. En telkens weer worden daar dan artikels over geschreven met bijhorende tips voor een lang leven.
Interessanter leek me de vraag hoe vaak we kunnen verwachten dat de oudste Belg komt te overlijden. En dat is een leuke analyse geworden (wie enkel het resultaat wil weten en niet de analyse zelf kan naar de laatste paragraaf scrollen).
De gegevens om dit te analyseren haalde ik van StatBel (vroegere Nationaal Instituut voor Statistiek). Daar kon ik zogenaamde ‘sterftetabellen’ downloaden.
In sterftetabellen staan een aantal statistieken, zoals het aantal inwoners voor elke leeftijd, de kans om te overlijden op elke leeftijd, levensverwachting, enz. Op basis van deze gegevens kunnen we ook een zogenaamde ‘overlevingscurve’ plotten.
Deze curve geeft voor elke leeftijd weer wat de kans is om minstens die leeftijd te bereiken. Bijvoorbeeld, in Belgie in 2013 is de kans om 85 of ouder te worden ongeveer 50%. Een curve die gerelateerd is aan de overlevingscurve is de risicocurve. Die curve geeft weer wat voor elke leeftijd de kans is te overlijden op die leeftijd.
Deze informatie zal ik nodig hebben voor de berekeningen. Maar, zoals je kan zien in de grafieken houdt StatBel enkel gegevens bij tot 105 jaar. Om ons probleem te kunnen oplossen hebben we echter gegevens nodig voor elke leeftijd tot ongeveer 122 jaar (de leeftijd van de oudste mens ter wereld ooit). We moeten de risicocurve dus op een of andere manier gaan extrapoleren. Dit heb ik gedaan door een machtsfunctie te schatten op de data (zie oranje lijn op figuur hieronder).
Op die manier heb ik voor elke mogelijke leeftijd een inschatting van het risico te overlijden op die leeftijd. Merk op dat voor leeftijden waar het geschatte risico groter dan 1 was, ik dit afgerond heb naar 1 (gebeurde vanaf 115 jaar, wat ouder is dan de oudste Belg ooit, i.e. 112).
Tenslotte heb ik nog het aantal Belgen per leeftijdsgroep nodig. Immers, je kan je voorstellen dat wanneer er veel kinderen en weinig bejaarden zijn dit zorgt dat de titel van ‘oudste inwoner’ minder snel afgelost zal worden. Deze data kan gemakkelijk uit de sterftetabellen gehaald worden. Echter, opnieuw worden alle mensen ouder dan 104 in dezelfde categorie onder gebracht. Dus moet er ook een schatting gemaakt worden van hoe die (74 gevallen) verdeeld zijn over de leeftijden 105 tot 110 (leeftijd huidige oudste Belg). Om dit te doen heb ik het cummulatieve product van de geschatte risicocurve berekend en dit gebruikt als kansen in een multinomiale verdeling.
Om de eigenlijke simulatie te kunnen doen moest ik een aantal assumpties maken. De belangrijkste is ongetwijfeld dat ik er van uit gegaan ben dat de risicocurve niet zal veranderen in de komende 10 jaar (en dat de staart ervan met een machtsfunctie beschreven kan worden). Wellicht is dit onrealistisch, maar door over een periode van slechts 10 jaar te simuleren hoop ik hieraan toch wat tegemoet te komen. Verder ben ik er ook van uit gegaan dat het risico om te overlijden binnen een bepaald jaar (dus elke dag van dat jaar) even groot is. Merk op dat deze assumpties ervoor zorgen dat de resultaten met de nodige kritische zin moeten worden bekeken.
In woorden werkt het simulatie algoritme ongeveer als volgt:
- Voor elke leeftijd, simuleer het aantal overlijdens adhv een binomiaalverdeling met n gelijk aan het aantal Belgen in die leeftijdscategorie en p gelijk aan het risico voor die leeftijd.
- Ga na of de oudste Belg overleden is (dit is gecompliceerder dan op het eerste zicht lijkt wegens mogelijk meerdere overlijdens van oudste Belgen binnen hetzelfde jaar).
- Indien ja, tel het aantal oudste Belgen die zijn overleden binnen datzelfde jaar. Simuleer hiervoor de sterfdagen uit de uniforme verdeling U[0,365].
- Vermeerder de leeftijd van alle niet overleden Belgen met 1.
- Simuleer het aantal geboortes (leeftijd 0). Hiervoor gebruikte ik het geboortecijfer van 2012 (i.e. ongeveer 126.000)
- Indien 10 jaar gesimuleerd, schrijf resultaten weg en begin opnieuw.
- Herhaal dit proces vele keren (i.e. 10.000 keer).
Onderstaande grafiek geeft het resultaat weer van 10.000 simulaties van overlijdens voor het komende decennium in België. Je ziet hoe vaak we kunnen verwachten dat de ‘oudste Belg’ zal komen te overlijden per jaar.
De waarde 1,5 is het meest waarschijnlijk. Dit betekent dat we kunnen verwachten dat we in het komende decennium ongeveer 1,5 keer per jaar (anders gezegd, 1 à 2 keer per jaar) in de krant te zullen lezen dat de oudste Belg is overleden. Als de kranten zich hiernaast ook nog interesseren voor ‘de oudste mannelijke Belg’ en ‘de oudste vrouwelijke Belg’ en ‘de oudste wereldburger’ enzovoort, dan mogen we ons aan een veelvoud van dergelijke artikelen verwachten. JOY!
Als toemaatje heb ik ook nog berekend wat de kans is dat het leeftijdsrecord van de oudste Belg ooit (112) overschreden zal worden het komende decennium. Het blijkt dat die kans ongeveer 28% bedraagt en indien dit inderdaad zou gebeuren dan mogen we verwachten dat deze heugelijke gebeurtenis zich binnen ongeveer 6.5 jaar zal voordoen.
Afspraak binnen 10 jaar voor mijn evaluatie…