Kijk eens wat de FT schreef over de gevaren van Big Data : http://www.ft.com/cms/s/2/21a6e7d8-b479-11e3-a09a-00144feabdc0.html#axzz2xS1VXiUc
Dat je veel gegevens hebt wilt nog niet zeggen dat je ze ook goed kunt interpreteren want er is zoiets als :
· Sample bias : Denken dat jou gegevens representatief zijn voor alle gegevens.
Voorbeeld : Ik heb 3 Limburgers gevraagd wat ze het liefste aten en ze zeiden “vlaai” dus alle limburgers eten het liefste vlaai.
· Correlation bias : Verkeerde conclusies trekken over hoe en uberhaupt of bepaalde gegevens een verband hebben of niet.
Voorbeeld verkeerd begrepen verband : vroeger dacht men dat autistische kinderen het “slachtoffer” waren van “koude moeders”, dus dat ze door gebrek aan aandacht van moeder autisitisch werden.
Nu is bekend dat genitische facturen en omgevingsfactoren een rol spelen (autistische moeders hebben meer kans op autistische kinderen, ook als die kinderen na geboorte door een niet-autistische moeder worden opgevoed).