poniedziałek, 26 stycznia 2015

Sondaż TNS 2015-01-21

Poznaliśmy wyniki nowego sondażu TNS. Badanie wykonano w dniach 16-21. stycznia na próbie 978 osób.

Szacowana frekwencja to 58% (w tym 22% zdecydowanych).

Wynik mojej analizy:

środa, 21 stycznia 2015

Sondaż Homo Homini dla Rzeczpospolitej 2015-01-15

Pojawiły się wyniki sondażu Homo Homini dla Rzeczpospolitej. Badanie wykonano w dniach 16-17. stycznia na próbie 1100 osób. I zupełnie nie wiem dlaczego ewybory.eu podaje dokładniejsze wyniki od zamawiającego sondaż.
Frekwencji nie podano, przyjmuję ostatnią znaną wartość: 55%.

Wynik mojej analizy:

niedziela, 18 stycznia 2015

Sondaż CBOS 2015-01-14

Badanie CBOS wykonano w dniach 8-14. stycznia na próbie 1005 osób. Frekwencja wyniosłaby 55%, a 26% ankietowanych jest zdecydowanych nie iść na wybory.
Styczniowe sondaże generalnie pokazywały zbliżone wyniki PO oraz PiS. CBOS, jak zwykle niepokorny, pokazuje w swoich wynikach coś zgoła odmiennego.

Wynik mojej analizy:

Sondaż TNS dla TVP Info 2014-01-13

Kolejny sondaż został wykonany przez TNS dla TVP. Badanie przeprowadzono w dniach 12-13. stycznia na próbie 1000 osób.
Na onet.pl te wyniki zostały opatrzone wykresem:

To, że Florence Nightingale użyła takiego wykresu wcale nie oznacza, że każdemu wolno. Ona sama też miała szansę użyć innej formy wizualizacji.
Flo w rozterkach - "..mogłam spróbować zrobić zwykły wykres liniowy :/"
Wynik mojej analizy:


Sondaż SMG/KRC 2014-01-12

Nadrabiam zaległości. Pierwszy w kolejce to sondaż MillwardBrown dla TVN. Będą jeszcze TNS dla TVP oraz CBOS. W międzyczasie pojawiły się też wyniki Homo Homini dla Rzeczpospolitej (coraz bardziej niekompletne) oraz grudniowe GFK. Te zapisałem do swojej bazy, ale tutaj je pominę - są już zbyt stare, by się nimi tak szczegółowo zajmować.

Badanie wykonano 12. stycznia na nieznanej próbie. Dla poniższych analiz przyjąłem typową wielkość 1000 osób. Nie znamy również frekwencji, więc przyjąłem 52% - ostatnią znaną wartość.
Wynik mojej analizy:


piątek, 9 stycznia 2015

Analiza obciążenia wyników partii i pracowni (2)

Dlaczego różne pracownie w krótkich odstępach czasu pokazują bardzo różne wyniki? W idealnym świecie ogromne różnice pomiędzy różnymi pracowniami powinny zdarzać się dość rzadko, tymczasem porównując CBOS do TNS czy Homo Homini różnica jest systematyczna.

Częściową odpowiedzią jest bias. Z braku lepszego polskiego określenia będę posługiwał się słowem obciążenie. Chodzi tu o systematyczne obciążenie wyników danej partii prezentowanych przez daną pracownię.

Powodów takiego obciążenia może być wiele: niereprezentatywny dobór próby do badania, dostępność bazy adresowej, sposób zadawania pytań, metoda wykonywania sondażu, problem z dotarciem do ankietowanych, odmowy udzielenia wywiadu, itd.

Natomiast efekt obciążenia jest natomiast łatwo zauważalny - dane ugrupowanie w sondażach pochodzących z jednej pracowni ma lepsze (gorsze) notowania, niż w sondażach z innych pracowni.

O co chodzi w tej plątaninie linii? Niżej je rozplączemy.

czwartek, 8 stycznia 2015

Wybory do sejmików - status

Otrzymałem odpowiedź z PKW odnośnie brakujących wyników z Warszawy:
Warszawa w dużym stopniu liczyła się "ręcznie". W bazie nie ma kompletu danych (brak 300 protokołów obwodowych z Rady Miasta i ponad 800 z sejmiku), więc nie ma ich i na wizualizacji.

PKW poleciła wpisanie brakujących protokołów do końca stycznia.

Mirosław Bogdanowicz
Zespół Prawny i Organizacji Wyborów
Krajowe Biuro Wyborcze
Pytanie wysłałem 19.12, odpowiedź przyszła 7.1. No, ale w międzyczasie była przerwa świąteczna. Dla uściślenia: brak "ponad 800 [protokołów] z sejmiku" to brak wszystkich, bo jest ich tam 886.

Gdy pojawią się nowe dane ściągnę ponownie wyniki z Mazowsza i przyjrzymy się głosom nieważnym. Tutaj może być bardzo ciekawie. Szukając w internecie jakie dokładnie stanowisko zajmuje pan Bogdanowicz natrafiłem na jego nazwisko w artykule z Gazety Wyborczej sprzed wyborów:
Tajemnicza plaga nieważnych głosów na Mazowszu. Dobrze głosują tylko wyborcy PSL
Czy mieszkańców obrzeży Mazowsza znów dotknie w tym roku dziwna przypadłość objawiająca się tym, że tak wielu oddaje nieważny głos w wyborach? Nie mylą się tylko wyborcy PSL.
Ciekawostka mazowiecka:
(...)na Mazowszu łatwiej zostać posłem (wybiera się tu ich 63) niż radnym województwa (50).
Ale ta mapa z wyborów 2010, robi na mnie największe wrażenie.

Odsetek głosów oddanych w wyborach do sejmików wojewódzkich w 2010 r., które były nieważne z powodu postawienia więcej niż jednego krzyżyka (źródło: prof. Przemysław Śleszyński)
Trochę zapala mi się w głowie lampka ostrzegawcza - dlaczego akurat takie przedziały i akurat taki dobór kolorów. Jednak coś jest na rzeczy.

W obecnych wyborach nie notowano dlaczego głosy były nieważne (zobacz przykładowy protokół). Komisje próbowały tylko uzasadniać dlaczego było mniej kart wydanych niż wyjętych z urny (najczęściej: bo wyborca zabrał kartę ze sobą). Można tylko pokazać odsetek nieważnych głosów ogółem w różnych przekrojach.

Mam ustawione różne alerty na wiadomości dotyczące wyborów i sondaży, ale tego artykułu wcale wcześniej nie widziałem. Dziwię się, że autor nie wrócił do tematu po wyborach - choćby po to, aby porównać cytowane wyniki i zweryfikować tezę zamykającą artykuł:
W tym roku tego dylematu nie będzie. Wszędzie stawiamy tylko jeden krzyżyk.

środa, 7 stycznia 2015

Trendy (6)

Zgodnie z obietnicą przedstawiam kolejny post z wykresami trendów sondażowych dla każdej z partii. Następny taki post pojawi się za trzy miesiące - na koniec marca. Wkrótce umieszczę też analizę obciążenia wyników poszczególnych partii i pracowni.

Liczyłem na to, ze GFK pokaże wyniki grudniowego sondażu przed Sylwestrem, ale się nie doczekałem.

Zebrałem wyniki 476 sondaży od połowy lipca 2010 do końca grudnia 2014. Przedstawię je tutaj jako serię wykresów.

Dane są ujednolicone i sprowadzone do odsetka zdecydowanych wyborców. Są więc to liczby porównywalne z rzeczywistym wynikiem wyborów z października 2011.

Na każdym z wykresów chmura kolorowych punktów to wyniki pojedynczych sondaży z poszczególnych pracowni. Szara pozioma linia to wynik z ostatnich wyborów na Sejm, szara pionowa linia to data tych wyborów, a pozioma turkusowa linia to 5% próg wyborczy.

Czarna linia to pewnego rodzaju uśrednienie, które ma wygładzić dane i zobrazować trend. Ta linia nie może jednak służyć do prognoz, ponieważ do znalezienia jej poziomu w każdym punkcie brane są wartości z całego otoczenia danego punktu - również z przyszłości.

Najpierw ogólny obraz:

Wartość dla PiS to suma poparcia PiS, Polski Razem oraz Solidarnej Polski.

Następnie zbliżenia na poszczególne partie.