Kad govorimo o prognozama pred izbore, važno je biti svjestan nekih stvari u vezi anketa javnoga mnjenja. Ponekad se na njih poziva kao na sigurni pokazatelj, drug pak ukazuju na slučajeve znatnih razilaženja anketa i stvarnih rezultata pa ih, neopravdano, posve odbacuju. Neka objašnjenja na poveznici koju sam dao još jučer. Neke ankete mogu biti sumnjive i očito namještene, ali većina su rađene korektno. Problem je, što mediji nikad ne objavljuju, a možda čak ni same agencije u priopćenjima ne ističu, granice greške.
Načelo je u tome da upitamo jedan broj ljudi "uzorak", recimo 1000 ljudi, te ako npr. 31,3% kaže da će glasovati za SDP, zaključemo da je tako i u ukupnom stanovništvu. Pri tome naravnotreba paziti da je uzorak "reprezentativan", odnosno da ljudi, po karakteristikama koje mogu utjecati na rezultat (spol, starost, stupanj obrazovanja, mjesto stanovanja isl.) budu zastupljeni u uzorku u istom postotku kao u generalnoj populaciji. Jasno je, da uzorak neće biti reprezentativan ako recio upitate 1000 studenata iz Zagreba ili 1000 stanovnika Gospića da to nije reprezentativno za cijelu Hrvatske.
Kriteriji za reprezentativnost uzorka najsloženiji su problem za provođenje anketa. Ako su oni dobro postavljeni, kod ovakvih jednostavnih pitanja dovoljan je i uzorak od nešto manje od 1000 ispitanika da se zaključi o raspoloženju populacije od četiri milijuna. Goleo iskustvo agencija gao što je Gallup to potvrđuje.
Treba naravno uzeti u obzir, također, čak i ako neka anketa precizno opisuje raspoloženje javnosti dva dana prije izbora, do dana izbora može se situacija promijeniti, jer je 2-3 posto neodlučnih otišlo na jednu stranu isl.. Također, neki se ne žele izjasniti kad ih pitaju, obično u većoj mjeri glasači desnih stranaka - no, ne mora biti kod nas tako. Konačno, za našu je situaciju važno i to, što se ankete vrše isključivo u Hrvatskoj, pa treba uračunati da je rspoloženje glasača koji nemaju boraviše u Hrvatskoj bitno različio..
Međutim, naravno, ako je 31,3% ispitanika reklo da će glasovati za SDP, ne možemo sa sigurnošću reći da je u općoj populaciji točno taj postotak. Naravno da postoji "granica greške"; navedeni postotajk je "srednja vrijednost" SV). Nikada se međutim o tome ne piše kad se rezultati prikazuju u medijima. Mjera granica greške naziva se "standardna devijacija" (SD) i ona bi morala biti navedena. Matematička je teorija bazirana na tzv. "normalnoj razdiobi" odnosno "Gausovoj krivulji". Bez potrebe da se shvati cijela teorija, Jedino što treba zapamitit jest da se stvarni razultat s vjerojatnošću od 68% u granicama između SV-SD i SV+SD, s vjerojatnošću 95% SV-2SD i SV+2SD, te s vjerojatnošću 99,7% SV-3SD i SV+3SD.
Dakle, ako je SV 31,3% a SD 1,1%, to znači da je sa 95% vjerojatnosti stvarna situacija u generalnoj populaciji da je između 29,1% i 33,5% u trenutku kad je anketa obavljena davalo glas SDP-u.
Ako se postojanje ove "greške mjerenja" ne uzme u obzir, prave se pogrešni zaključci koji onda mogu osvanuti i na naslovnicama novina. Tako je PMSM (Po Mom Skromnom Mišljenju), bilo 2007. godine, kad su naslovi kričali da SDP pobjeđuje, a pobijedio je HDZ: Rezultati su zapravo bili u granicama greške.
Kako ja nešto znam o statistici, volio bih vidjeti da se uz postotak objavi i standardna devijacija. To je bio problme pred izbore 2007., kad su se ankatam PMSM (Po Mom Skromnom Mišljenju) neopravdeano nakon izbora rugalo anketama, koje su davale prdnost SDP-u. rezultati su bili u granicama greške.
Isto upozorenje vrijedi i kad se radi o projekcijama na osnovu "izlaznih anketa" na dan izbora.
Post je objavljen 02.10.2009. u 21:07 sati.