Kolejność ma znacznie, czyli odcinek o tym, że nie można testować hipotezy na tych samych danych, z których tę hipotezę wyciągnęliśmy albo o tym, że jak się człowiek uprze to znajdzie porządek w chaosie. A najbardziej o teksańskim snajperze i co oznacza błąd z nim związany.
W tej serii opowiadam o bardziej i mniej znanych modelach mentalnych, czyli uproszczonych schematach myślenia tworzonych przez nas mózg, których poznanie ułatwia zrozumienie świata i podejmowanie decyzji.
Transkrypcja odcinka
Pewien zmyślny Teksańczyk postanowił zostać strzelcem wyborowym. Jako że był zmyślny, to postanowił się też nie napracować. Dlatego najpierw oddał strzały w drzwi stodoły, a dopiero później dorysował cele w miejscach trafień. Rozbawiła was ta historia? Myślę, że nie powstydził był się jej Karol Strasburger. Ten żart jest używany do opisania błędu z dziedziny statystyki nazywanego błędem teksańskiego snajpera po angielskie: texas sharpshooter fallacy.
Na czym polega? Załóżmy, że chcecie dokonać jakiegoś odkrycia, ale jeszcze nie wiecie jakiego. Przeprowadzacie więc ankiety wśród ludzi, zbierając dane na różne tematy, a następnie szukacie w nich prawidłowości. Wreszcie znajdujecie coś, co wydaje się idealną hipotezą. A teraz trzeba tę hipotezę sprawdzić, prawda? No ale wy wyciągnęliście ją z danych, więc jest od razu udowodniona. Et voila, hipoteza zamieniała się w tezę. No, tylko że nie. Nie można potwierdzać hipotezy na tych samych danych, z których ja wysnuliśmy.
Powyższy przykład to prawdziwa historia, która zdarzyła się w Szwecji. Badano wpływ linii wysokiego napięcia na zdrowie. Ankietowano osoby żyjące w promieniu 300 metrów od linii wysokiego napięcia na występowanie chorób z listy ponad 800 możliwych. Zauważono znacząco odbiegający od średniej wzrost zachorowań na dziecięcą leukemię. Pominięto jednak fakt, że statystycznie, jeśli badamy występowanie ponad 800 chorób, jest bardzo prawdopodobne, że uda nam się znaleźć wartości odbiegające od średniej. Kolejne badania nie znalazły powiązań między mieszkaniem w pobliżu linii wysokiego napięcia a dziecięcą leukemią.
Błąd teksańskiego snajpera to więcej niż tylko statystyka. Jesteśmy tak zbudowani, że szukamy porządku w chaosie. Jeśli będziemy się długo przyglądać widocznemu teraz rozkładowi punktów, zauważymy pewne grupy. Jednak punkty te zostały rozmieszczone całkiem losowo. Warto pamiętać o tym modelu mentalnym, kiedy pracujemy z danymi.
Przed zakończeniem chciałbym powiedzieć o jeszcze jednym przykładzie. Interpretacje dzieł Nostradamusa, gdzie są one po pierwsze luźno przetłumaczone z archaicznego języka francuskiego, po drugie obdarte z historycznego kontekstu a po trzecie dopasowane do aktualnych wydarzeń to wypisz wymaluj błąd teksańskiego snajpera.
Ещё видео!