czwartek, 20 listopada 2014

Kluczowe momenty

Mniej niż miesiąc temu programiści Twitter.com opublikowali pakiet dla R o nazwie BreakoutDetection. Pakiet umożliwia znajdowanie w danych momentów, w których nastąpiła zmiana reżimu:

  • nagłe przesunięcie średniej - np. po uruchomieniu nowej aplikacji zużycie procesora zwiększa się o 20% i pozostaje takie przez pewien czas
  • stopniowe przejście ze starego stanu do nowego stanu - np. po uruchomieniu nowej aplikacji zużycie procesora stopniowo rośnie do poziomu o 20% wyższego od obecnego i pozostaje takie przez pewien czas
Pakiet BreakoutDetection przeprowadza analizę używając algorytmu E-Divisive with Medians (EDM) i jest nieparametryczny, czyli nie nakłada żadnych założeń co do modelu danych. Algorytm używa median, więc jest odporny na odstające obserwacje.

Zobaczmy, co ciekawego można znaleźć w wynikach modelu nr 1.

Najpierw odfiltrowane wyniki historyczne. Poziome odcinki to średnie w danym okresie, pionowe fragmenty to momenty zmian wykryte przez algorytm.

Zobaczmy, o jakie konkretnie dni chodzi dla poszczególnych ugrupowań

PO

Ostatnia znaleziona data to 5. września, gdy zaczęły się wzrosty. To mniej-więcej tydzień po tym, jak Donald Tusk dostał nową pracę.

PiS

Szczyt notowań PiS przypadł w połowie lipca, być może to artefakt danych - wtedy ogłoszono, że PiS będzie startował wspólnie z SP i PR.
Zmiana reżimu została wykryta 23. sierpnia.

SLD


Bardzo dużo szumu.

PSL


KNP


TR


Brak komentarzy:

Prześlij komentarz