Metody Komputerowej Analizy Danych

Testy nieparametryczne

błąd standardowy średniej: S_e = s / sqrt(n); gdzie s to odchylenie standardowe

Populacja: N(m, b); Próba (x, s)
α=0.05; to 95% przedział ufności - że w zakresie od (punkty wyznaczane z tablic lub statisticą) znajduje się nieznany parametr n.
Aby zwiększyć tą pewność należy albo rozszerzyć ten przedział albo zwiększyć próbkę pobieraną z populacji

Aby sprawdzić jaki rozkład mają obrabiane dane należy porównywać ich wykres z wykresem odpowiedniego rozkładu.

Skośność -0.5 < sk < 0.5 - w miarę symetryczny
-1.5 < sk < 1.5 - skrajnie niesymetryczny

Kurtoza - stopień spłaszczenia

Metody komputerowej analizy danych, Statistica 5.5 - Ćwiczenia 4

Statystyki nieparametryczne itp

Mamy cechę X (rozkład normalny N) N(m, sigma)
P{śr(x) - błąd oszacowania <= ?? <= śr(x) + błąd oszacowania} = 1 - alpha
Popularne rozkłady do ztestowania N, t-studenta, Mana-Witneya

Ocena normalności rozkładu

stat. ogólne | test dla prób niezależnych [zależnych]
p - prawdopodobieństwo, że się mylimy, kiedy przyjmujemy ze słuszną hipotezę ...
nauczyć się porównanie ze względu na cechę - np ze względu na płeć

Cechy niemierzalne

płeć, rodzaj studiów

Związki pomiędzy dwoma cechami

Analiza | tabele korelacji
Wyniki - tablelaryzacja

Jaki procent w próbie posiada daną cechę, a jaki inną

podstawowe statystyki | panel początkowy | tabele liczebności
Oczywiście wszystko dla odpowiedniej zmiennej

Ocena symetryczności rozkładu

Należy obliczyć skośność danej zmiennej, dodatkowo można zbudować histogram częstości i wizualnie ocenić symetryczność rozkładu

1 2 3 4 5 [6] 7 8 9 10 11 12

Tagi analiza danych anova dane komputer regresja

Informatyka Gospodarcza, Zarządzanie