Model nr 1 umożliwia mi przedstawienie tych informacji jednocześnie w bardziej spójny sposób.
Oto wyniki historyczne aż do 2013-11-30:
Szara pionowa linia to dzień wyborów w październiku 2011. Kolorowe linie to rzeczywiste poparcie partii wynikające z modelu. Szare linie to odpowiadające im przedziały 95% pewności wyniku.
- PiS po maksimum notowań w sierpniu zaczął spadać
- PO z tego powodu wcale nie zyskuje
- a wydaje się, że ostatnio zaczyna zyskiwać SLD
Zwięźle przypomnę założenia do modelu nr 1:
- wszystkie dane są sprowadzone do wspólnej bazy: osób zdecydowanych na to, na które ugrupowanie chcą oddać głos
- każdego dnia, w którym jest sondaż mamy nową informację, która uaktualnia stan wiedzy: notowania danej partii są aktualizowane zgodnie z regułą Bayesa, a niepewność wyniku zmniejsza się
- każdego dnia, w którym nie ma sondażu wiemy mniej niż poprzedniego dnia: notowania partii zostają bez zmian, a niepewność wyniku zwiększa się
- w dniu wyborów wyniki są pewne
- sondażowy wynik każdej z partii jest sumą jej rzeczywistego poparcia oraz stałego obciążenia powiązanego z pracownią, która wykonała dany sondaż
Spójrzmy teraz na wynik z ostatniego dnia obserwacji - 2013-11-30, już z uwzględnieniem wyników z ewybory.eu.
Liczby po prawej stronie to średnie poparcie wśród zdecydowanych wyborców. Liczby w nawiasach to końce przedziału, w którym na 95% znajduje się rzeczywiste poparcie dla danej partii.
Dla np. PiS można więc powiedzieć, że mamy 95% pewność, że ich poparcie wśród zdecydowanych wyborców wynosi od 33,3 do 39,9 punktów procentowych, a średnio 36,7%.
Kluczowe informacje:
- PiS przed PO, PO przed SLD, SLD przed PSL i Twoim Ruchem (Palikota)
- PSL ma 85% szans na wejście do Sejmu, na 61% z wynikiem lepszym od TR
- TR ma 57% szans na zasiadanie w parlamencie, na 88% w wyborach uzyskałoby wynik lepszy od KNP
- KNP ma tylko 1 szansę na 100 na przekroczenie progu wyborczego, na 73% jednak z wynikiem lepszym od PJN
Drugim wynikiem z modelu nr 1 jest oszacowanie obciążenia wyników prezentowanych przez daną pracownię. Wykres prezentujący te parametry:
Nie jest to jeszcze najlepsza metoda pokazania tego wyniku, jednak daje pewien pogląd. Widzimy na przykład, że średnio wyniki PO raportowane przez CBOS i TNS są lepsze, a te z ewybory.eu - gorsze od rzeczywistego poparcia wynikającego z modelu.
Oto tabelka z liczbowymi rezultatami. Kolory oznaczają, że na 95% dany parametr jest różny od zera.
Patrząc na tę tabelę można na przykład powiedzieć, że wyniki z CBOS średnio zawyżają wynik PO o 5 punktów procentowych, a wyniki z ewybory.eu - zaniżają je o 4 punkty procentowe.
Kilka obserwacji:
- każda z pracowni trafnie pokazuje wynik co najwyżej połowy ugrupowań
- najgorzej pod tym względem wyglądają wyniki ewybory.eu, co wcale nie powinno dziwić - ten sondaż nie jest reprezentatywny
- średnio najmniejszy błąd popełnia w swoich sondażach TNS, choć problemy zdarzają się każdemu
Należy zwrócić uwagę, że rezultat w powyższej tabeli absolutnie nie może być używany jako uzasadnienie tezy, że któraś z pracowni robi sondaże z "wynikami na zamówienie". Tego rodzaju obciążenie można wyjaśnić bez uciekania się do nieetycznych motywów: np. niereprezentatywny dobór próby do badania, dostępność bazy adresowej, sposób zadawania pytań, metoda wykonywania sondażu, problem z dotarciem do ankietowanych, odmowy udzielenia wywiadu, itd.
Brak komentarzy:
Prześlij komentarz