wtorek, 2 czerwca 2015

Podsumowanie maja

Oto wyniki modelu zatrzymane w czasie na dzień ostatniego sondażu w maju 2015-05-20. Do modelu wchodzą wyłącznie sondaże dotyczące wyborów na Sejm.

Techniczny opis modelu można znaleźć tutaj. Przedstawiane niżej liczby dotyczą poparcia w grupie osób zdecydowanych co do pójścia na wybory i jednocześnie zdecydowanych na ugrupowanie, na które chcą głosować. Model ma za zadanie usunąć z wyników poszczególnych sondaży błąd wynikający z systematycznego obciążenia wyników danej pracowni dla danej partii.

Zacznijmy od wykresu z wynikami historycznymi - od momentu nieco przed poprzednimi wyborami aż do dnia ostatniego znanego sondażu.



Szare linie to kanały, w których na 95% znajduje się rzeczywiste poparcie dla danej partii. Pionowa linia wyznacza dzień poprzednich wyborów parlamentarnych.

Wyniki odfiltrowane z szumu wyglądają tak:

Wskaźnik koncentracji sceny politycznej to liczba wzięta z ekonomii. Indeks przyjmuje wartości z zakresu [0,1], gdzie jeden oznacza monopol jednej partii, a zero to jednakowe poparcie każdej partii.
Oto wyniki na dzień ostatniego sondażu:


Liczby po prawej stronie to średnia wartość poparcia, liczby w nawiasach, to przedział, w którym na 95% znajduje się rzeczywiste poparcie danej partii.

Prognozowane wyniki na ostatni dzień miesiąca pokazywałyby te same wartości średnie, tylko z szerszymi przedziałami ufności, czyli z większą niepewnością.

Wykres poniżej obrazuje średni rozrzut pomiędzy wynikami danej sondażowni, a wynikami zagregowanego modelu. Można z niego np. odczytać, że ewybory.eu średnio podaje zawyżony wynik dla TR i zaniżony dla PO.



Ta sama informacja w bardziej konkretnej formie. Kolorowe pola oznaczają wartości na 95% różne od zera.



Inaczej: wyniki podawane przez ewybory.eu podają poparcie dla TR średnio większe o 4 punkty procentowe od poparcia z modelu.

Patrząc na wiersze tabeli widzimy, że całkiem wiarygodnie wyglądają wyniki podawane dla większości partii przez TNS.

Spoglądając na kolumny widać, że największa zgodność (najwięcej szarych pól - wartości nieodróżnialnych od zera) pomiędzy pracowniami panuje obecnie przy podawaniu wyników SLD.

1 komentarz:

  1. Szanowny Panie,
    jednym z tematów moich prac badawczych jest modelowanie opinii w oparciu o podejście socjofizyczne i modele wieloagantowe. [ Sądzę że najprościej będzie gdy podam link do profilu w Google Scholar https://scholar.google.pl/citations?user=o6ua6coAAAAJ&hl=en ].

    W chwili obecnej pracuje nad rozszerzeniem modelu Emocje/informacje/Opinie tak by spróbować odtworzyć obecne załamanie duopolu PiS/PO.

    Pański blog jest jedny z niewielu, podających dane empiryczne w sposób, który obejmuje inteligentną agregację wyników sondaży i pozwala na oszacowanie błędów. Stąd dwie prośby:
    1. chciałbym w pracy zacytować Pańskie wyniki (jeśli zalezy Panu na anomimowości jako powołanie do strony, jeśli inaczej - prosze wskazać jaka forma Panu odpowiada), w tym uzyskać zgodę na zamieszczenie kopii wybranych wykresów.
    2. O ile to mozliwe prosiłbym o przesłanie danych stanowiących podstawę do wykresów, w szczególności przebiegu ewolucji czasowej poparcia dla partii politycznych oraz dla kandydatów w niedawnych wyborach prezydenckich.

    Z poważaniem,
    Paweł Sobkowicz
    pawelsobko@gmail.com

    OdpowiedzUsuń