Metody Komputerowej Analizy Danych
Metody komputerowej analizy danych, Statistica 5.5 - Ćwiczenia 5
test ze staroci :-(
Statistica - Anova (analiza wariancji) - Metody wielowymiarowe
Dla zmiennej X: N(m, sigma)
H0 - wszystkie zarobki równe
H1 - istnieje wśród wszystkich co najmniej jedna para gdzie jest inaczej
p ~ 0 - odrzucenie H0
p ~ 1 - brak podstaw do odrzucenia H0
Wyniki - interpretacja
1 - cecha 1
2 - cecha 2
12 - interakcje pomiędzy cechami 1 i 2
Metody komputerowej analizy danych, Statistica 5.5 - Ćwiczenia 6
Ciąg dalszy modułu Anova. Może po kolei. Na początek jak wykonać podstawowe zadania w tym module. Należy wynaleźć dane... Biorąc pod uwagę, że jest to w sumie najtrudniejsza sprawa - ponieważ większość z nich zawiera jakieś mankamenty typu BD, czyli brak danych, lub jest ich tam zbyt wiele, to mając ten etap za sobą mamy już zdecydowanie z górki :-D
Moduły |
Anova/Manova | [Otwórz dane] | Menu - Analiza | Panel początkowy
Teraz wybieramy zmienne niezależne (tymczasowo uznajemy je jako niezależne wobec cechy badanej). Powiedzmy, że będą to V3,V4 i V5 a więc płeć, wykształcenie oraz miejsce zamieszkania. Teraz należy sprawdzić, czy owe zmienne wpływają na zmienną V6 czyli dochód miesięczny. Wpływ ten należy ocenić dla wszystkich oraz każdej z osobna oraz interakcji pomiędzy zmiennymi. Bez modułu Anova analiza taka - wielowymiarowa nie była by możliwa.
OK | Kody dla czynników
między grupowych | Wszystkie | OK | OK | średnie/wykresy
Zaznaczmy opcję odpowiednią dla potrzeb. Gwoli wyjaśnienia na liście efektów znajdują się teraz 3 pozycje w postaci wybranych wcześniej zmiennych niezależnych oraz kilka innych 12, 13, 23, 123 - to są właśnie interakcje. Teraz możemy potestować sobie wszystkie z tych opcji - należy zaznaczyć aktualnie oceniany związek / zmienną / interakcje i OK. Pojawiają się tabele w których wybieramy kolejność zmiennych na wykresie, inaczej mówiąc reprezentacje odpowiednich osi. W zasadzie nie ma znaczenia jak to wybierzmy. Można jednak przypuszczać, że bardziej sensowny jest podział na miasto i wieś czy płeć niż na wysokość dochodu ;p. To może nie jest zbyt dobry przykład, gdyż Anova zajmuje się cechami jakościowymi - jako zmiennymi niezależnymi. Przejrzystość wykresu dodatkowo wymaga więc odpowiedniego doświadczenia w doborze kolejności cech. To może na początek niech zostanie zaznaczone domyślnie.
Opcja ta również powoduje automatyczne wyliczenie elementów pełnej tabeli wszystkich efektów. Następnie zostanie wyświetlone okno dialogu pozwalające wybrać efekty proste i wyświetlić wykres średnich (interakcji) lub arkusz wyników (nieważonych) średnich. Opcja ta stanowi najszybszy sposób badania istotnych efektów w przypadku złożonych układów ANOVA.