sobota, 16 maja 2015

Wybory prezydenckie 2015 - Analiza obciążenia sondaży przed pierwszą turą

Model nr 1, którego wyniki publikuję na tej zakładce, wymaga kalibracji faktycznymi wynikami wyborów. Z tego powodu nie mogłem go użyć przy okazji wyborów prezydenckich przed ogłoszeniem wyników pierwszej tury.

Wyniki zostały ogłoszone, więc jaki teraz pożytek z modelu?

Otóż mogę go użyć do oszacowania obciążenia wyników pracowni badawczych i odjęcia tego obciążenia od opublikowanych wyników sondaży.

Czy błędy są podobne do tych z sondaży parlamentarnych? Zobaczmy.

Najpierw wykres z wygładzonymi danymi historycznymi, po usunięciu wpływu obciążenia pracowni na wynik poszczególnych kandydatów.




Szok i niedowierzanie - gdybyśmy znali prawdziwą wielkość niedoszacowania poparcia dla Andrzeja Dudy, to już na początku kwietnia można by podejrzewać, że ma spore szanse wyprzedzić prezydenta Komorowskiego. Przedziały 95% wiarygodności wewnątrz szarych linii nie rozdzielają się, więc moglibyśmy tylko wiedzieć, że jest remis i różnica między nimi jest niewielka.

Surowe wyniki sondaży pokazywały w pierwszej połowie kwietnia przewagę obecnego prezydenta o ponad 10 punktów procentowych.

Widać, że w trakcie kampanii Bronisława Komorowskiego nie udało się zupełnie nic. Skok poparcia na samym końcu to artefakt z danych - efekt dodania wyników kilku sondaży ogłoszonych tego samego dnia po majowej przerwie. Poparcie dla prezydenta wzrosło na koniec, ale wcześniej przez ponad tydzień (od 30.4 do 7.5) model mógł pokazać tylko kontynuację trendu spadkowego.

Gdybym mógł znać to obciążenie, to 8. maja mógłbym pokazać ten wykres:

i dwa dni później zyskać sławę :).

Jak więc obciążenie sondaży rozkłada się pomiędzy kandydatów i pracownie?

To wykres dość podobny do wyników parlamentarnego modelu. Nie jest na przykład niespodzianką, że CBOS przeszacowuje kandydata PO, niedoszacowuje kandydata PiS.

Oto podsumowanie wykresu w formie tabeli ze średnimi. Kolorem oznaczone są przypadki, które na 95% są różne od zera.


Byłoby pewną niespodzianką, że wynik sondaży ewybory.eu (sic!) dość trafnie oddawał poparcie dla Dudy, Komorowskiego i Kukiza (sic!). Niestety to również artefakt danych - mam zapisane tylko trzy takie sondaże: jeden z lutego i dwa z marca. Model przypisał tej pracowni tak szerokie przedziały wiarogodności wyniku, że każdy rezultat stał się prawdopodobny.


Brak komentarzy:

Prześlij komentarz