wtorek, 19 listopada 2013

Model nr 1 - wyniki

W poprzednim, bardzo technicznym, wpisie podałem założenia i mechanizm Modelu nr 1. Tutaj przedstawię wyniki.


Szare linie to przedziały, w których na 95% znajduje się wynik danej partii. Pionowa linia wyznacza dzień wyborów na Sejm w październiku 2011. W tym dniu wyniki każdej z partii zbiegają się do jej poparcia w oficjalnych wynikach.

W każdym z pozostałych dni wynik jest aktualizowany w sposób, podany w metodologii. Przypomnijmy:

  • jeśli w danym dniu pojawił się sondaż, to wnosi on nową informację - zwiększa dokładność pomiaru i wpływa na korektę wpływu danej pracowni na wynik danej partii
  • jeśli w danym dniu nie było sondażu, to poparcie danej partii jest podobne do poparcia z poprzedniego dnia z rosnącą niepewnością co do dokładności pomiaru
Przypominam, że Model nr 1 nie nadaje się do prognoz. Powie nam tylko tyle, że jutrzejszy wynik będzie taki, jak dziś, ale z większą niepewnością.

Tak wygląda ostatni odczyt, z 2013-11-14 - z ostatnimi danymi, które trafiły do obliczeń:


Obie osie obrazują to samo - oszacowane poparcie jako odsetek zdecydowanych wyborców. Słupki błędów mają taki sam zasięg, jak szare linie na pierwszym wykresie - to przedziały, w których na 95% znajduje się wynik danej partii.

Widzimy więc, że do Sejmu na pewno dostałyby się trzy partie, dwie mają na to duże szanse, a pozostałe dwie mogą mieć duże problemy.

Gdybym prowadził gazetę, albo telewizję, to wyniki pokazałbym tak:


Szok i niedowierzanie:
  • 10 punktów procentowych przewagi PiS nad PO
  • mocne SLD - 12%
  • PSL z 7% poparciem na pewno w Sejmie
  • ostatnią partią byłby Twój Ruch (Palikota) z 5% poparciem
  • PJN i KNP miałyby po 2% poparcia

Trzecim ważnym wynikiem z modelu jest oszacowanie obciążenia poszczególnych sondaży. Tym razem podam tylko średnie wartości, bez przedziałów 95% prawdopodobieństwa, ponieważ za późno zorientowałem się, że pełne dane nie były zapisywane z modelu.


Jak rozumieć wyniki z tej tabelki:
  • wartością odniesienia jest rzeczywiste poparcie partii oszacowane wg Modelu nr 1
  • wyniki to średnie wartości obciążenia, nie można wziąć ostatniego sondażu TNS, od wyniku PO odjąć 4,2 punktu procentowego i stwierdzić, że to prawdziwe poparcie PO
  • można jednak zauważyć, że CBOS średnio zawyża wynik PO o 4,5 punktu procentowego i zaniża wynik PiS o 3 punkty procentowe
  • ewybory.eu średnio podaje wynik PO niższy o 4,9 punktu procentowego, a wynik RP (Twojego Ruchu) wyższy o 4,6 punktów procentowych
  • Homo Homini średnio podaje wynik SLD wyższy o 4,5 punktu procentowego
W tabeli jest wiersz z parametrami GFK. Ta pracownia przestała publikować wyniki sondaży po ostatnich wyborach parlamentarnych.

Co tu można wyczytać ciekawego:
  • wynik PSL jest raczej niedoszacowany - tutaj podejrzewam problem ze skutecznym dotarciem do elektoratu tej partii
  • natomiast wynik SLD jest przeważnie przeszacowany - to jest dla mnie ciekawe, bo nie mam żadnego pomysłu dlaczego tak by się miało dziać
  • bez przedziałów ufności nie można skomentować kolumn z wynikami PiS, PJN i KNP, bo nie wiadomo czy te wartości są istotnie różne od zera
Model nr 1 nie jest skończony. Zaskoczyły mnie dwie sprawy: tak bardzo "poszarpany" wynik RP na przełomie 2011/2012 oraz brak trendu rosnącego KNP w ostatnich miesiącach. Być może do analizy albo zbioru danych wkradły mi się jakieś błędy.

Brak komentarzy:

Prześlij komentarz