poniedziałek, 20 maja 2013

Źródła danych

Źródłem danych są informacje prasowe publicznie dostępne w internecie. Staram się wyłuskać z nich maksimum informacji przy użyciu nowoczesnej statystyki.

Jakość prezentowania wyników sondażów jest zazwyczaj bardzo niska. Oto informacje, które powinny być zawsze umieszczane:
  1. wyniki: deklaracja udziału w wyborach, popierana partia i jej poparcie w procentach,
  2. wielkość próby
  3. co jest podstawą liczenia procentów:
    • cała próba
    • respondenci, którzy nie odmówili udziału w sondażu
    • respondenci, którzy deklarują udział w wyborach
    • respondenci, którzy deklarują udział w wyborach i powiedzieli, na którą partię chcą głosować
  4. metoda doboru próby – reprezentatywna, sondaż uliczny, sonda internetowa
  5. sposób zbierania danych – ankiety telefoniczne (CATI), internetowe, wizyta ankietera
  6. termin wykonania badania
Bardzo istotnym elementem jest informacja o tym, co jest podstawą liczenia procentów. Stąd właśnie wynikają rozbieżności w sondażach publikowanych w tych samym tygodniu, gdy jedna pracownia podaje poparcie lidera na poziomie 30%, a druga mówi o 43%.

Najczęściej różnica polega na tym, że pierwsza pracownia podaje wynik w odniesieniu do wszystkich, którzy chcą iść głosować, a druga w odniesieniu tylko do tej grupy, która wie na kogo chciałaby zagłosować.

W moich szacunkach staram się wydedukować, co faktycznie było podstawą liczenia procentów i odpowiednio określić parametry do replikacji.

Nie jestem związany z żadną pracownią i korzystam z publicznych źródeł informacji, dlatego pewne problemy pozostaną niewyjaśnione. Pracownie mają swoje bazy adresów i metody wykonywania sondaży, do których nie mamy dostępu.

Na tym blogu zajmuję się tylko błędem statystycznym. Nie jest wielkim odkryciem, że wyniki poszczególnych pracowni są obciążone też błędem systematycznym – niektóre zawsze mają np. niedoszacowany PSL, a przeszacowane wyniki PO.

Nie podejrzewałbym jednak nikogo o świadome manipulowanie. Wynika to raczej z trudności dotarcia do reprezentatywnej próby i wielkiej liczby odmów udziału w sondażach. A osoby, które nie chcą odpowiadać w sondażach też chodzą na wybory.

3 komentarze:

  1. Ważne jest też "gdzie" wykonywana była dana próba. PIS chce mieć dobry sondaż? To robią go tam gdzie mają największe poparcie (np dzwonią do ludzi mieszkających w danym mieście lub nawet danej dzielnicy. Poza tym kto powiedział że sondaż rzeczywiście był zrobiony? Ludzie się pod tym podpisali? Ano nie. Nie podają dowodów na to ze sondaż faktycznie się odbył.
    Przydały by się na pana?? (zakładam że osoba płci męskiej) Blogu linki do stron sondażowych oraz licznik wejść.

    OdpowiedzUsuń
  2. Tak, jestem mężczyzną i tak, na tym blogu oprócz samej treści potrzeba też trochę pracy nad "obramowaniem" :). Dziękuję za komentarz.

    Być może jakaś firma z własnym call center robi sondaże "z wynikiem na zamówienie". Ale to kłopotliwe i kosztowne. Dużo taniej byłoby pokazać wyniki bez robienia sondażu.

    Dla dużych pracowni głównym klientem są firmy zlecające badania rynku - jak sprzedać więcej batoników albo kolorowej wody z cukrem. Dla takich pracowni sondaże polityczne nie są ważnym źródłem dochodu, bardziej traktowanym jak forma reklamy i promocji własnej marki. Z tego powodu mam do nich większe zaufanie, bo przez próby manipulacji mogliby stracić zaufanie swoich klientów korporacyjnych.

    OdpowiedzUsuń
  3. To też powinno sie znaleźć w osobnym artykule. Czyli jakie mamy w Polsce firmy sondażowe, jak robią dane sondaże (plus po krótce mechanizm), oraz pana podejście do autentyczności ankiety danej pracowni. Tak jak pisałem. Dzwonić mogą lecz nawet jeśli są dowody na to że ankieta się odbyła i że było wszystko ok to mogli wygrać "rejon" ankiety taki a nie inny. Dodatkowo jakiś artykuł po co właściwie są robione takie ankiety? Bo nie ulega przecież wątpliwości ze ankiety takie mają jakiś swój określony (nie koniecznie jawny) cel. Powodzenia i mam nadzieje że pańskie chęci do prowadzenia bloga będą z czasem co najmniej takie same jak nie większe. ps. Robi pan backup strony tak na wszelki wypadek?

    OdpowiedzUsuń