Metody Komputerowej Analizy Danych
Testy nieparametryczne
błąd standardowy średniej: Se = s / sqrt(n); gdzie s to odchylenie standardowe
Populacja: N(m, b); Próba (x, s)
α=0.05; to 95% przedział ufności - że w zakresie od (punkty wyznaczane z tablic lub statisticą)
znajduje się nieznany parametr n.
Aby zwiększyć tą pewność należy albo rozszerzyć ten przedział albo zwiększyć próbkę pobieraną z
populacji
Aby sprawdzić jaki rozkład mają obrabiane dane należy porównywać ich wykres z wykresem odpowiedniego rozkładu.
Skośność -0.5 < sk < 0.5 - w miarę symetryczny
-1.5 < sk < 1.5 - skrajnie niesymetryczny
Kurtoza - stopień spłaszczenia
Metody komputerowej analizy danych, Statistica 5.5 - Ćwiczenia 4
Statystyki nieparametryczne itp
Mamy cechę X (rozkład normalny N) N(m, sigma)
P{śr(x) - błąd oszacowania <= ?? <= śr(x) + błąd oszacowania} = 1 - alpha
Popularne rozkłady do ztestowania N, t-studenta, Mana-Witneya
Ocena normalności rozkładu
stat. ogólne | test dla prób niezależnych [zależnych]
p - prawdopodobieństwo, że się mylimy, kiedy przyjmujemy ze słuszną hipotezę ...
nauczyć się porównanie ze względu na cechę - np ze względu na płeć
Cechy niemierzalne
płeć, rodzaj studiów
Związki pomiędzy dwoma cechami
Analiza | tabele korelacji
Wyniki - tablelaryzacja
Jaki procent w próbie posiada daną cechę, a jaki inną
podstawowe statystyki | panel początkowy | tabele liczebności
Oczywiście wszystko dla odpowiedniej zmiennej
Ocena symetryczności rozkładu
Należy obliczyć skośność danej zmiennej, dodatkowo można zbudować histogram częstości i wizualnie ocenić symetryczność rozkładu