niedziela, 19 maja 2013

Zaczynamy


Start!

Głównym celem istnienia tego bloga jest wizualizacja wyników sondaży poparcia partii politycznych z uwzględnieniem ich niepewności (uncertainity).

W prezentacji wyników sondażu powinna być podana informacja o tym, że błąd statystyczny wynosi np. 3%, ale co to właściwie znaczy? Czy jeśli partia ma poparcie 5% to jej wynik wynosi między 2%, a 8%? 

Nigdy nie widziałem w prasie wyniku sondażu politycznego z wąsami błędów naniesionymi na słupki poparcia.

Na blogu będą też co jakiś czas publikowane zagregowane i ujednolicone (to nie to samo, co uśrednienie) wyniki sondaży wykonanych w tym samym czasie przez różne pracownie. 

Na blogu będą publikowane wykresy i komentarze dotyczące wyników sondaży przedwyborczych. Jednak nie jest to blog polityczny i nie będę dyskutował, która partia jest lepsza i dlaczego. Chodzi mi wyłącznie o podejście metodologiczne i wnioski z analizy błędu.

Chcę wycisnąć z politycznych słupków maksimum dostępnej informacji.

Mam nadzieję, że czytelnicy bloga będą chcieli poznać odpowiedzi na pytania w rodzaju:

  • czy zmiana poparcia na 32% wobec 30% w zeszłym tygodniu ma jakieś znaczenie?
  • czy wynik 6% naprawdę oznacza, że partia prawie na pewno wejdzie do Sejmu przy progu wyborczym 5%?
  • jakie jest prawdopodobieństwo, że kolejność partii wg ich poparcia jest właśnie taka, jak na słupkach?

Znalezienie odpowiedzi na takie pytania wymaga nieco skomplikowanych obliczeń, ale odpowiedzi te są łatwe do prezentacji i podsumowania na wykresie.

O mnie

Jestem niezależnym analitykiem, wykonuję tę pracę w swoim prywatnym czasie, nie działam na żadne zlecenie, nie jestem i nigdy nie byłem związany z żadną instytucją wykonującą badania poparcia partii politycznych.

Zapraszam do czytania i subskrypcji wpisów.

2 komentarze:

  1. Jestem zdegustowany wyłącznie procentową prezentacją wyników. Same procenty w końcowych wynikach i podziale respondentów na grupy niewiele mówią. Poniżej próba prezentacji sondaży w układzie tabelarycznym (zniekształconym przez rozmiary pola). Daje się to znakomicie zapisać w Excelu i w tym układzie powinny być wyniki pokazywane w przynajmniej w firmach sondażowych.


    Data sondażu Respondenci ogółem Rezygnujący z wyborów Zainteresowani wyborem Zainteresowani wyborem Bez wskazania partii Wskazujący partie PO PiS RP PSL SLD SP PJN NPJKM Reszta

    5-10.10.2012 osoby 972 389 583 583 105 478 Wskazania na partie 158 166 38 29 62 13 6 6 0
    % 100 40 60 100 18 82 % zainteresowanych 27 28 7 5 11 2 1 1 0
    100 % wskazujących 33 35 8 6 13 3 1 1 0

    4-10.10.2012 osoby 1007 413 594 594 142 452 Wskazania na partie 166 143 24 29 48 18 24
    % 100 41 59 100 24 76 % zainteresowanych 28 24 4 5 8 3 4
    100 % wskazujących 37 32 5 6 11 4 5

    3-5.10.2012 osoby 1000 210 790 790 245 545 Wskazania na partie 180 212 27 27 49 50
    % 100 21 79 100 31 69 % zainteresowanych 23 27 3 3 6 6
    100 % wskazujących 33 39 5 5 9 9

    7-10.09.2012 osoby 959 403 556 556 128 428 Wskazania na partie 158 145 30 26 41 12 6 10 0
    % 100 42 58 100 23 77 % zainteresowanych 28 26 5 5 7 2 1 2 0
    100 % wskazujących 37 34 7 6 10 3 1 2 0

    2-5.08.2012 osoby 968 404 564 564 130 434 Wskazania na partie 181 127 38 25 37 16 3 7 0
    % 100 42 58 100 23 77 % zainteresowanych 32 23 7 4 7 3 1 1 0
    100 % wskazujących 42 29 9 6 9 4 1 2 0

    5-7.07.2012 osoby 958 406 552 552 127 425 Wskazania na partie 179 125 30 27 43 21
    % 100 42 58 100 23 77 % zainteresowanych 32 23 5 5 8 4
    100 % wskazujących 42 29 7 6 10 5

    wyniki prognozujące wejście do Sejmu (osiągnięcie progu 5%) w obu wariantach sondażu

    OdpowiedzUsuń
  2. Myślę, że obie informacje są ważne.

    Dane procentowe - dlatego, że jeśli zakładamy, że statystyka działa i próba była reprezentatywna, to dane procentowe powinny przekładać się na ostateczny wynik.

    Konkretne liczby też są ważne, zwłaszcza jeśli dotyczą partii o mniejszym poparciu. Jeśli mamy próbę 1000 osób, 500 chce iść na wybory, to nagle fakt, że jakąś partię wskazało 23, a nie 28 osób może być warte gazetowego nagłówka.

    Do opracowań na tym blogu i muszę przejść z procentów na pojedynczych respondentów, pomyślę jak pokazać informacje na oba sposoby.

    OdpowiedzUsuń