Metody Komputerowej Analizy Danych

Korelacja cech

Metody komputerowej analizy danych, Statistica 5.5 - Ćwiczenia 7

Koło - Statistica 5.5 - Anova cz. II - Dokładaniejsza analiza średnich międzygrupowych.

Anova | [otwórz dane - niech będą te z poprzedniego paragrafu] | Menu - Analiza | Panel początkowy lub wznów analizę

Zmienne niezależne: V3, V4, V5 - płeć, wykształcenie, miejsce zamieszkania
Zmienne zależne: V6 - dochód miesięczny

kody dla czynników międzygrupowych | wszystkie | ok | ok | porównania post hoc | czynniki - wszystkie 3 | ok | 2 pierwsze opcje - średnie lub test NIR, planowane porównanie

post hoc - łac., po tym, a więc wskutek tego (przykład błędnego wyprowadzania stosunku przyczyny i skutku ze zwykłego następstwa w czasie

W średnich mamy teraz wyliczone wartości średnich dla wszystkich podgrup składających się na całą próbkę. Możemy opowiedzieć o różnicach w stosunku do globalnej średniej. Oraz skrajnych przypadkach - czyli grupach zarabiających najmniej, lub najwięcej.

Test NIR - to już zupełnie inna sprawa. Po prawidłowym odpaleniu pojawia się wielka tablica, która jest symetryczna względem przekątnej diagonalnej. Jest to więc macierz diagonalna. Wektor opisujący nazwy danych jest kolumnach jest transpozycją wektora dla wierszy i z niego możemy odczytać pełne nazwy. Dla uproszczenia wiersze i kolumny są indeksowane.

Test NIR; zmienna DOCHMIES - Prawdopodobieństwo dla testów post hoc - INTERAKCJA 1 x 2 x 3

Jak teraz interpretować wyniki. Co prawda nie jest to cała tabela - ale resztę można zrobić w sposób analogiczny. Oryginalna tabela dla 3 zmiennych niezależnych i jednej zależnej będzie miała 12 x 12 pól. Aż tyle ponieważ należy aby uwzględnić wszystkie podgrupy należy połączyć je każdy z każdym a badane cechy V3, V4 i V5 są jakościowe i posiadają odpowiednio 2, 3 i 2 różnych wartości. Wynik 12 to zwyczajny iloczyn 2*3*2.

Dla przykładu weźmy sobie dowolne pole, gdzie wartość jest mniejsza od 0,05. Odczytujemy w pierwszym wierszu i kolumnie czego dotyczy wynik np 11/1 (11 wiersz, 1 kolumna). Mężczyźni z wykształceniem wyższym mieszkający w mieście zarabiają w istotny sposób inaczej niż kobiety z miasta ale z wykształceniem podstawowym. średnie ich dochodów przy żądanym poziomie istotności (0,05) są znacząco różne. Wysokość tych średnich można odczytać na górze: 766,67 do 3931,25 zł.
W ten sposób możemy opowiedzieć o zależnościach występujących w całej tej macierzy odzwierciedlających prawidłowości, zależności i związki znajdujące się w badanej próbce.

1 2 3 4 5 6 7 8 [9] 10 11 12

Tagi   analiza danych   anova   dane   komputer   regresja