Obsah:

4 způsoby, jak lhát se statistikami
4 způsoby, jak lhát se statistikami
Anonim

Jedním z nejúčinnějších způsobů, jak lhát, je nesprávná interpretace statistik. Znalost toho, jak se s čísly žongluje, vám může pomoci všimnout si, že se vás někdo snaží oklamat.

4 způsoby, jak lhát se statistikami
4 způsoby, jak lhát se statistikami

Sbírejte data, díky nimž budou vaše závěry ještě neobjektivnější

Prvním krokem při shromažďování statistik je určit, co chcete analyzovat. Statistikové v této fázi volají informace. Dále musíte definovat podtřídu dat, která by při analýze měla reprezentovat celou populaci jako celek. Čím větší a přesnější vzorek, tím přesnější budou výsledky výzkumu.

Samozřejmě existují různé způsoby, jak náhodně nebo úmyslně zkazit statistický vzorek:

  • Předpojatost výběru. K této chybě dochází, když se lidé účastnící se studie identifikují jako skupina, která nereprezentuje celou populaci.
  • Náhodné vzorkování. Vyskytuje se, když jsou snadno dostupné informace analyzovány spíše než snaha shromáždit reprezentativní data. Zpravodajský kanál může například provést politický průzkum mezi svými diváky. Aniž bychom se zeptali lidí, kteří sledují jiné kanály (nebo televizi nesledují vůbec), nelze říci, že výsledky takové studie budou odrážet realitu.
  • Odmítnutí účasti respondentů. K takové statistické chybě dochází, když někteří lidé neodpovídají na otázky položené ve statistické studii. To vede k nesprávnému zobrazení výsledků. Například, pokud studie položí otázku: "Podváděl jste někdy svého manžela?" Ve výsledku se bude zdát, že nevěra je vzácná.
  • Volný přístup k anketám. Takových průzkumů se může zúčastnit každý. Často se ani nekontroluje, kolikrát stejná osoba odpověděla na otázky. Příkladem jsou různé ankety na internetu. Je velmi zajímavé je projít, ale nelze je považovat za objektivní.

Krása výběrového zkreslení spočívá v tom, že někdo někde pravděpodobně provede nevědecký průzkum, který podpoří jakoukoli teorii, kterou máte. Stačí tedy na webu vyhledat anketu, kterou chcete, nebo si vytvořit vlastní.

Vyberte výsledky, které podpoří vaše nápady

Vzhledem k tomu, že statistiky používají čísla, zdá se nám, že přesvědčivě dokazují jakoukoli myšlenku. Statistika se opírá o složité matematické výpočty, které při špatném zacházení mohou vést ke zcela opačným výsledkům.

Aby demonstroval nedostatky v analýze dat, vytvořil anglický matematik Francis Anscombe. Skládá se ze čtyř sad číselných údajů, které na grafech vypadají úplně jinak.

lhát statistikou
lhát statistikou

Obrázek X1 je standardní bodový graf; X2 je křivka, která nejprve stoupá nahoru a pak klesá dolů; X3 - čára, která mírně stoupá nahoru, s jednou na ose Y; X4 - údaje na ose X, kromě jednoho překmitu umístěného vysoko na obou osách.

Pro každý z grafů platí následující tvrzení:

  • Průměr x pro každý soubor dat je 9.
  • Průměr y pro každý soubor dat je 7,5.
  • Rozptyl (spread) proměnné x - 11, proměnné y - 4, 12.
  • Korelace mezi proměnnými x a y pro každý soubor dat je 0,816.

Pokud bychom tato data viděli pouze ve formě textu, mysleli bychom si, že situace jsou úplně stejné, ačkoli to grafy vyvracejí.

Proto Enscombe navrhl, abyste si data nejprve vizualizovali a teprve potom vyvozovali závěry. Pokud chcete někoho uvést v omyl, tento krok samozřejmě přeskočte.

Vytvořte grafy, které zvýrazňují požadované výsledky

Většina lidí nemá čas na vlastní statistickou analýzu. Očekávají, že jim ukážete grafy shrnující celý váš výzkum. Dobře navržené grafy by měly odrážet nápady, které odpovídají realitě. Mohou však také zvýraznit data, která chcete zobrazit.

Vynechat názvy některých parametrů, mírně změnit měřítko na souřadnicové ose, nevysvětlovat souvislosti. Můžete tak všechny přesvědčit, že máte pravdu.

V každém případě skryjte zdroje

Pokud otevřeně citujete své zdroje, je pro lidi snadné ověřit vaše zjištění. Samozřejmě, pokud se snažíte všechny získat kolem prstu, nikdy neříkejte, jak jste ke svým závěrům došli.

Obvykle jsou v článcích a studiích vždy uvedeny odkazy na zdroje. Originální díla přitom nemusí být poskytnuta v plném rozsahu. Hlavní věc je, že zdroj odpovídá na následující otázky:

  • Jak probíhal sběr dat? Byli lidé dotazováni telefonicky? Nebo se zastavili na ulici? Nebo to byla anketa na Twitteru? Způsob sběru informací může naznačovat určité chyby výběru.
  • Kdy se potkali? Výzkum rychle zastarává a trendy se mění, takže načasování shromažďování informací ovlivňuje závěry.
  • Kdo je sbíral? Výzkum tabákové společnosti o bezpečnosti kouření je málo důvěryhodný.
  • Kdo byl dotazován? To je důležité zejména pro průzkumy veřejného mínění. Pokud si politik udělá průzkum mezi těmi, kdo s ním sympatizují, výsledky nebudou odrážet názor celé populace.

Nyní víte, jak manipulovat s čísly a používat statistiky k prokázání téměř čehokoli. To vám pomůže rozpoznat lži a vyvrátit smyšlené teorie.

Doporučuje: