Alles wat Jan bezig houdt, interesseert en irriteert... en ook een beetje onzin...

woensdag, mei 11, 2011

Re: The Drunkard's Walk - Thanks and question regarding Benford's law

Hey Freek,

Had je hier al antwoord op gehad ?

Ik kwam zelf ook een voorbeeld tegen waar ik het niet mee eens was.

Wat ik niet snapte was de Bayesiaanse statistieken voorbeeld.
Een echtpaar heeft 2 kinderen. Een van de 2 is een meisje. Hoe groot is de kans dat de andere ook een meisje is ?
Het antwoord in het boek :
Zoek eerst alle opties op (de zogeheten sample space). Dus : jongen-jongen, meisje-jongen, jongen-meisje, meisje-meisje. (we gaan ervan uit dat hermafrodieten niet bestaan). De jongen-jongen optie valt af omdat een een meisje was. Dus we houden 3/4 opties over. van deze 3 is 1 de meisje-meisje optie. de kans op nog een dochter is dus 1/3 = 33%.
Tot zover ben ik het ermee eens. Maar dan... In het boek gaat hij op dit voorbeeld door.
Wat is de kans dat beide kinderen meisjes zijn als je van een van de 2 kinderen weet dat ze Florida (een niet vaak voorkomende naam in de VS) heet ?
Zijn antwoord is bijna hetzelfde als bovenstaande, echter let op wat hij eraan toe voegt :
Zoek eerst alle opties op (de  zogeheten sample space ). Dus : jongen-jongen, meisje-jongen, jongen-meisje, meisje-meisje, jongen-florida, meisje-florida, florida-meisje, meisje-meisje florida-florida. (we gaan ervan uit dat hermafrodieten niet bestaan). De jongen-jongen optie valt af omdat een een meisje was. en Florida-Florida valt af omdat mensen hun dochters meestal niet beide dezelfde naam geven. Dus we houden 4/9 opties over. De kans is dus bijna 50%. 
Ik ben het hier niet mee eens. De de reden is 2 ledig : 

  • omdat Florida een naam is, en niet verzekerd dat het kind echt een meisje is (je hebt wonko-ouders die hun jongen een meisjes naam geven)
  • de sample space zou naar mijn mening met neutrale informatie gevuld moeten worden, dus een naam doet zo-ie-zo niet mee. 
Nu is het grappige dat er in de academische wereld een hele discussie over dit zelfde voorbeeld woed, alhoewel men schermt met meer wiskunde dan dat ik heb gekregen op school, maar misschien vind jij het interessant :



2011/3/14 Freek 
Dear Dr. Leonard Mlodinow,

A few days ago, a good friend of mine lend me his copy of 'The Drunkard's Walk'.
Currently I'm halfway, and it's a truly enjoying book. The
counter-intuitive examples are very interesting.
It's been a while since my last mathematics course, thus some
information requires extra research on my side.

One of these was Benford's law (discussed on pages 82 and 83). As I
didn't understand the logic, I did some further digging.
During this, the thought occurred to me that the example mentioned
(Harlem's illegal lottery) is not influenced by Benford's law.
As only the last five digits are used, and these always range from
00000 to 99999, and not the first five, the power of logarithmic
mentioned in Benford's law should not have any influence.
That is, unless the U.S. debt is less than a million dollars.

Even if the first five digits would be used, the effect of Benford's
law would be very small, as the lottery was daily and it takes the u.s
debt a few decades to increase ten-fold.
On the other hand of course, the first five digits are all but random,
and thus unsuitable for a lottery.

Please correct my thinking if I made a mistake. I hope you can expand
my understanding.
I would like to thank you again for your wonderful book, and look
forward to finishing it.

Friendly greetings,
Freek,
The Netherlands.