Bilance testů paranormálních schopností za posledních 10 let, Německo

18.duben 2016 Paranormální výzva

Před deseti lety vypsala německá skeptická společnost GWUP odměnu ve výši 10 000 € za důkaz nějaké paranormální schopnosti. Ucházejí se o ni lidé s nejrůznějšími tvrzeními. Přijatí uchazeči jsou od roku 2004 každoročně Reinerem Wolfem a Martinem Mahnerem testováni s použitím vědeckých metod. Některé dodatečné testy zajistila televize, belgičtí skeptici a americká nadace Jamese Randiho. Doposud ještě nebyl u žádného z testů důkaz paranormálních schopností podán a tak je dále možné se o 10 000 € ucházet.

Zdroj: časopis Skeptiker 4/2014, přeložil Milan Urban

Po deseti letech a 55 testech jsme provedli bilanci. Vyhodnocení testů je rozděleno na tři části, protože ne všechny testy jsou navzájem srovnatelné. V první části jsou hodnoceny výsledky testů "1 z 10". Jde zde o testy, u kterých má například proutkař najít mezi deseti krabicemi tu, ve které je schována sklenice s vodou. Aby kandidát v testu uspěl, musel mít při 13 pokusech sedm nebo více správných odpovědí. Ve druhé části jsou hodnoceny výsledky testů "1 ze 2". V těchto testech je úkolem testované osoby například pomocí deklarované paranormální schopnosti zjistit, zda v nějakém kabelu proud teče nebo ne. Zde by kandidát byl v testu úspěšný, kdyby při 50 pokusech bylo 40 správných odpovědí.

 

U obou typů testů se vyhodnocuje vždy jen první fáze a v té − aby získal uchazeč hodnocení "uspěl" − musel být úspěšný nejméně v 7 (1 z 10) resp. 40 (1 ze 2) pokusech. Pokud se mu to podaří, musí ze statistických důvodů dosáhnout ve druhé fázi testu kladného výsledku v 10 z 18 pokusů (varianta 1 z 10), resp. 46 z 60 pokusů (varianta 1 ze 2). Protože dosud nikdo v první fázi testů neuspěl, nebylo zatím nutné ke druhé fázi přikročit. Podrobné vysvětlení použité statistiky, použité při testování, viz "O statistice testů" na konci článku. Třetí část vyhodnocení testů zahrnuje ostatní testy, které do prvních dvou částí nezapadají, resp. které vykazují nějaké zvláštnosti.

Typ testu 1 z 10 1 ze 2 (1 ze 2a) ostatní / zvláštní
Počet testů 35 11 (3) 6


Testy provedené od roku 2004 můžeme se zřetelem na způsob provedení a schopnosti testovaných rozdělit následovně: 43 (78,18%) testů byly testy "detekční", tzn., že testované osoby chtěly předměty nebo jejich "vyzařování" ať už přirozené nebo jimi samotnými vyvolané (např. energetizováním) detekovat pomocí proutku, kyvadla, ruky nebo jinými postupy. Tři testy byly testy, při kterých kandidáti ochutnávali "energetizovanou" vodu nebo víno. Předvídání budoucnosti bylo testováno dvakrát (3,64%), psychokineze rovněž dvakrát (3,64%) a spirituální diagnostika jednou (1,82%). Čtyři další testy (7,27%) jsou zde zařazeny pod "různé". Patří mezi ně test jednoho homeopatika s použitím diagnostického přístroje, zhotoveného samotným kandidátem (viz Skeptiker 4/2008, strana 199), dále "komunikace s duchovním světem" pomocí kineziologického testu paže (viz Skeptiker 3/2001, strana 132), test homeopatického hnojiva a test hnojiva spirituálního pro rostliny (viz Skeptiker 3/2014, strana 128).

Pětapadesáti testů se zúčastnilo jen šest žen, přičemž jednomu testu předvídání budoucnosti se podrobily dvě studentky, které jsou ale započteny jako jedna testovaná osoba, takže přesně vzato pouhých pěti testů se zúčastnily ženy jako testované osoby. Souvisí to nejen s velmi malým zájmem žen o testování, nýbrž také se skutečností, že ženami deklarované schopnosti lze většinou testovat jen stěží nebo vůbec ne. Patří k nim například léčitelské schopnosti, které lze ověřovat jen nákladnými klinickými studiemi. GWUP se musí omezit na jednoduché a finančně únosné testy, které navíc poskytují všem zúčastněným jednoznačné výsledky. Nelze připustit výsledky, které by dávaly prostor pro různé výklady a zdlouhavé, nic neřešící diskuze. Tento problém se vyskytuje například u astrologických nebo jiných předpovědí a to je oblast, které se právě ženy často věnují. Extrémním příkladem bylo tvrzení jedné ženy, že pozná, zda pohřbená osoba byla otrávená nebo ne. GWUP by v osobě Marka Benecka měla pro takový test kompetentního poradce, ale exhumace na různých místech jsme považovali za poněkud nákladné ...

Testy "1 z 10"

Podle pravidel pro testy "1 z 10" bylo dosud provedeno 35 testů. Pro jejich hodnocení není důležité jen to, že se při testech dosud žádnou paranormální schopnost nepodařilo dokázat. Zajímaly nás vždy i konkrétní výsledky, a zda se tyto výsledky odchylují od náhody.

Protože je 13 pokusů, může testovaná osoba mít 0 až 13 zásahů. Například procento pravděpodobnosti dosáhnout při čistém hádání tří správných odpovědí je 10%. Pravděpodobnost obstát v tomto testu při pouhém hádání, tedy dosáhnout nejméně 7 správných odpovědí, je menší než 0,01%. Tzn., že z 10 000 testovaných osob by při pouhém hádání v tomto testu obstála v průměru 1 osoba. Průměrný počet správných odpovědí při hádání má hodnotu 1,3. Spolu s druhou fází testu by se pravděpodobnost uspět čistým hádáním, a tím získat odměnu, snížila z 1 : 10 000 na 1 : 5 miliardám.

Testy jsou navrženy tak, že testované osoby, které své paranormální schopnosti potvrdí z 81%, by v testu obstály s pravděpodobností >99%. GWUP tedy neočekává, že paranormální schopnosti fungují "vždy", i když většina kandidátů zpočátku tvrdí, že jejich paranormální schopnosti zaručují úspěch na 100%.

Jak vypadá skutečně dosažená úspěšnost? Nulová úspěšnost řešení byla lehce nadprůměrně častá, jedno správné řešení lehce podprůměrně časté, 2, 3 a 4 správná řešení byla blízko očekávané náhodné pravděpodobnosti.

Doposud neměla žádná testovaná osoba více než 4 správná řešení.

Správná řešení 0 1 2 3 4 > 4
Počet 11 10 9 4 1 0

Průměrný počet správných odpovědí u všech testovaných osob se s hodnotou 1,26 zásahů nachází velmi blízko očekávané hodnotě 1,3. Z těchto výsledků lze vyvodit, že testované osoby nedopadly o nic lépe než osoby bez údajných paranormálních schopností, které by jednoduše jen hádaly.

Testy "1 ze 2"

Podle pravidel pro testy "1 ze 2" bylo dosud provedeno 11 testů. Aby srovnání s testy "1 z 10" bylo férové, platí pro první fázi testů tohoto typu, že má-li uchazeč 40 správných odpovědí v 50 kolech, pak uspěl.

Průměrný počet při pouhém hádání je 25, potřebný počet správných odpovědí pro hodnocení "uspěl" je 40. I tyto testy jsou vytvořeny tak, že pokud by tvrzení testované osoby odpovídala skutečnosti, byl pro ni test s pravděpodobností vyšší než 99% úspěšný. Pouhým hádáním by v tomto testu bylo možné obstát s pravděpodobností ca 1 : 80 000. Ve druhé části testu by se tato pravděpodobnost redukovala na cca 1 : 4 miliardám.

Počet správných odpovědí v těchto testech měly testované osoby mezi 19 a 32. Ani u tohoto typu testu ještě žádný kandidát nedosáhl jejich potřebného počtu. Protože dosavadní počet testů podle těchto pravidel je velmi malý a žádný pokus nebyl úspěšný, nesledují skutečné výsledky testů přesně křivku náhodné pravděpodobnosti.

Průměrný počet správných odpovědí všech testovaných osob je s hodnotou 26 o něco vyšší než očekávání podle náhody (25). Když i nadále žádný kandidát v testu neobstojí, lze očekávat, že skutečně dosažené počty správných odpovědí se s rostoucím počtem testů budou přibližovat křivce pravděpodobnosti.

Správné odpovědi 19 20 21 22 23 24 25 26 27 28 29 30 31 32 > 32
Počet 1 0 0 1 0 2 1 0 1 3 0 1 0 1 0

Testy, odbočující z "1 ze 2"

V prvních testech GWUP z roku 2004 nebyly tři testy "1 ze 2" provedeny úplně korektně podle naplánované statistiky. Místo aby bylo pro každé kolo určeno losem, zda má na daném místě předmět být nebo ne, byly předměty a prázdná místa rozděleny 50/50, což bylo známo i kandidátům. Tím se zvyšuje pravděpodobnost správné odpovědi, a proto přísně vzato nejsou výsledky s jinými testy "1 ze 2" srovnatelné. Statistika musela být v těchto případech přepočítána, což ovšem na neúspěchu testovaných osob nic nezměnilo. Podrobněji k této variantě testů "1 ze 2a" lze najít v publikaci Wolf/Sarma (2005).

Tento problém se týkal testu s "energetizovanou" vodou, která se měla poznat podle chuti. Testovaná osoba dosáhla v testu 34 správných odpovědí. Je to sice méně, než pro úspěšný test požadovaných 40, ale více než jinak dosažený nejvyšší počet správných odpovědí 32. Při metodicky korektnějším opakování testu, u kterého byla voda důkladněji promíchána, přičemž vedoucí testu měl rukavice, aby nezanechal na sklenicích při jejich plnění pachové stopy, měla testovaná osoba už jen 22 správných odpovědí. Další test dle varianty "1 ze 2a" byl proveden s menším počtem kol. Místo obvyklých 50 jich bylo jen 38. Jednalo se o 38 fotografií pacientů jedné nemocnice, z nichž jedna polovina měla nemocné srdce, druhá polovina trpěla nějakou jinou nemocí. Kandidátka měla pomocí fotografií "spirituálně " diagnostikovat pacienty s nemocným srdcem. Úspěšná byla v 18 případech z 38 (47%). Aby v testu obstála, musela by být diagnóza správná ve 34 případech.

Ostatní/zvláštní testy

Z celkových 55 testů bylo 6 takových, které měly poněkud jiný design než testy "1 z 10" nebo "1 ze 2", nebo u kterých byly nějaké jiné zvláštnosti, kvůli kterým je nebylo možné zařadit do žádné z předešlých kategorií a proto je uvádíme odděleně.

Patřily mezi ně dva testy psychokineze. Jedna testovaná osoba chtěla uvést do pohybu obličejovou masku z aluminiové fólie, zavěšenou na vlasu jeho ženy (viz Skeptiker 2/2005, str. 48). Druhý kandidát se pokoušel pohnout papírem, spočívajícím na hrotu jehly. Požadováno bylo v obou případech zřetelně viditelné otáčení v různých směrech, ale k tomu nedošlo. Ve třetím testu chtěl kandidát pomocí virgule a kyvadla lokalizovat malý prut zlata, zakopaný v zemi. Nejdříve místo zakopání prutu blíže na mapě ohraničil a pak určoval přesné místo, na kterém se prut v zemi nachází. Správné místo minul o ca. 20 km (viz Skeptiker 3/2011. str. 132-135).

Jeden ze šestice pokusů realizován nebyl, protože už předběžné nezaslepené pokusy byly neúspěšné. Kandidát chtěl pomocí virgule určit energeticky příznivé seřazení schránek mušlí a šneků ve vedlejší místnosti. Test měl proběhnout dle metody testu "1 ze 2" (viz Skeptiker 4/2008, str. 199). Ve dvou zbývajících pokusech šlo o tažení míčků z vaku a testovaná osoba měla předpovědět, který míček bude vytažen jako příští (Ertel 2007). Na míčcích byla čísla od 1 do 5. Očekávaná pravděpodobnost správné náhodné předpovědi je kolem 20%. Při 420 taženích lze v tomto ohledu očekávat v průměru 84 správných předpovědí. Aby kandidát testem prošel, musel by mít nejméně 122 úspěšných předpovědí, ale těch bylo jen 99. Při druhém pokusu, provedeném stejným způsobem, došlo na přání kandidátek ještě k další úpravě. Kromě čísel 1 až 5 měla být předpovězena i barva (červená nebo zelená), kterou byly číslice na míčcích napsány, například: "číslo 2 v červené barvě". Tím klesla pravděpodobnost správné předpovědi na 10%. Při 300 pokusech lze tedy v tomto ohledu očekávat v průměru 30 správných odpovědí. Testu se podrobily dvě osoby, jedna měla 25, druhá 36 správných předpovědí.

Protože se jedná o stručný přehled, nebylo možné popsat jednotlivé testy podrobně.

O statistice testů

(Reiner Wolf)

Hodnotící kritéria zvolil matematik a statistik Volker Guiard tak, aby na jednu stranu byla testovaná osoba asi z 99% úspěšná, pokud by údajné schopnosti skutečně měla (Guiard 2005). Tzv. "power" je tedy o něco větší než 0,99.

Power závisí na velikosti schopnosti, tj. na míře úspěšnosti, ve kterou kandidát věří a kterou sám musí odhadnout. Všichni kandidáti tvrdili, že ve svých vlastních testech byli na 100% úspěšní. Ve prospěch testovaných osob byla "laťka" úspěšnosti nastavena jen na 81% (1 z 10) resp. 90% (1 ze 2). I úspěšně testované osoby tedy mohou chybovat.

Na druhou stranu musí být takřka vyloučeno, aby kladného výsledku bylo dosaženo čistě náhodou − takzvaná hodnota "Alfa" (p) musí být tedy dostatečně malá. Z těchto úvah vyplývají pro postačující hodnoty alfa a power přesná kritéria úspěšnosti.

Malá hodnota alfa je opatřením proti chybě prvního druhu (chybně kladný výsledek), t.j. přisouzení zvláštních schopností osobě, ačkoli ta měla pouze štěstí. Vysoká hodnota power chrání testovanou osobu před neoprávněným označením "neúspěch", tj. před chybou druhého druhu (nesprávně negativní výsledek).

Abychom se vyhnuli chybě prvního druhu, musíme stanovit signifikantní hranici vyšší, než je obvyklé ve vědeckém výzkumu. Například v psychologii často už stačí pravděpodobnost omylu p < 0,05. To znamená, že průměrně každou 20. publikaci lze považovat za chybnou. V biologii a v medicíně se zpravidla požaduje hodnota p < 0,01, takže v průměru jen v jedné ze 100 publikací lze očekávat chybně vyvozené závěry. Ve fyzice jsou nároky ještě o dva řády vyšší: teprve při signifikaci p < 0,0001 se považují závěry za spolehlivé.

Jde-li o pochybné myšlenky, jsou právem statistické požadavky ještě mnohem vyšší.

Pravděpodobnost, že vysoce signifikantní výsledek je dílem náhody, nemůže být zjištěna čistě statisticky. Jinými slovy: z hodnoty p = 0,05 vyvozovat − jak se často děje − pravděpodobnost omylu 5%, je nepřípustné. Neboť malé hodnoty p neudávají přímo pravděpodobnost, že vysoce signifikantni výsledek vznikl náhodně. Je k tomu ještě potřeba mít jisté povědomí o pravděpodobnosti, zda může být daný efekt vůbec reálný. Teprve spolu s tímto povědomím se nechá pomocí Bayesova vzorce spočítat pravděpodobnost omylu (Nuzzo 2014).

Přítomnost vedoucího testů nemohl výsledek testů negativně ovlivnit, neboť v nezaslepených testech, provedených před i po těch dvojitě zaslepených, byly testované osoby úspěšné. Každý, kdo deklarované paranormální schopnosti má, je tedy mohl bez problémů demonstrovat.

Test 1 z 10 část 1 část 2

  nkalfainvers-alfapower
Stupeň 1 13 7 0,000099285 10,072 0,993
Stupeň 2 18 10 0,000002046 488 998 0,997
Celkem 31 17 2,0316.10-10 4 922 228 785 0,989

Test 1 ze 2 část 1 část 2

  nkalfainvers-alfapower
Stupeň 1 50 40 0,000011931 83 815 0,991
Stupeň 2 60 46 0,000021119 47 350 0,999
Celkem 110 86 0,00000000025196 3 968 883 950 0,990

 

 

Poděkování
Chtěl bych poděkovat všem, kteří mě při zpracování tohoto článku podpořili. Byli to: Martin Mahner, Inge Hüsgen, Rainer Wolf a Michael Kunkel.

Literatura: (vše v jazyce německém)

Ertel, S. (2007) Mimosmyslové vnímání pod kontrolou organizovaných skeptiků (Zeitschrift für Anomalistik 7: 236-239)
Guiard, V. (2005) Jak se statisticky stanoví hranice, kterou musí úspěšný kandidát překonat: Skeptiker 18(2): 55-56.
Nuzzo, R. (2014) Signifikantní omyl. Mozek a duch, sešit 9, 34-39.
Wolf, R.; Sarma,. A. (2005) Würzburgské testy paranormálních schopností 2004. Skeptiker 18(2): 48-54.

Stefan Soehnle, nar. v roce 1981 v Böblingen je diplomovaným fyzikem (univerzita Stuttgart). Absolvoval též magisterské studium na vysoké škole Steinbeis Hochschule v Berlíně (obor Businees and Enginnering). S GWUP již 3 roky při testování spolupracuje.

Zdroj: Testy paranormálních psychických schopností organizované německými skeptiky z GWUP v letech 2004 - 2014, Stefan Soehnle, časopis Skeptiker 4/2014, přeložil Milan Urban

 

 

Vytisknout článek

Poodhalíme vám skrytá tajemství.