Powtarzane pomiary: czy je mam i ile ich mam?

7 marca 2022 | author

Facebook

Kwestia powtarzanych pomiarów, czy planów z czynnikami wewnątrzobiektowymi jest trochę skomplikowana i przy okazji myląca studencką brać. Nie ma co ukrywać, sprawa jest dość niejasna na pierwszy rzut oka i żeby zrozumieć jak to działa trzeba Cię przeprowadzić przez kilka innych kałuż statystycznych, żeby nauczyć Cię odróżniania tych czynników wewnątrzobiektowych. I co najważniejsze – chcemy nauczyć Cię umiejętności liczenia tychże. Pokażmy to!

GDZIE I KIEDY ZNAJDĘ W SWOICH BADANIACH POWTARZANY POMIAR?

Przygotowaliśmy dla Was już poradniki wyboru właściwego testu statystycznego; algorytm wyboru testu statystycznego zaczyna się od określenia typów zmiennych które posiadamy (poradnik1, poradnik2), a następnie wyboru jednej z trzech ogólnych grup testów.

Jedna grupa dotyczyła sytuacji w której mamy tylko zmienne o charakterze kategorii (zmienne nominalne): na przykład płeć i ulubione zwierzę. W tym pierwszym przypadku określamy liczebności podgrup – na przykład sprawdzamy czy wśród kobiet jest więcej miłośniczek psów czy kotów i czy ilość miłośników psów vs kociarzy w grupie mężczyzn jest podobna. Poradnik był tu, dodatkowe uwagi pisaliśmy tu. To nie powtarzane pomiary.

Druga grupa dotyczyła sytuacji w której mamy tylko zmienne numeryczne (ciągłe, ilościowe): na przykład wiek i wzrost. Chcieliśmy dowiedzieć się czy między wzrostem a wiekiem jest jakaś zależność, albo czy ilość zjedzonej czekolady wpływa na poziom zadowolenia z życia. Mamy jakieś dwie zmienne ciągłe i je ze sobą zestawiamy. Pisaliśmy tu. To też nie powtarzane pomiary.

Trzecia grupa testów to testy międzygrupowe, które zawierają i takie i takie dane: na przykład płeć i wzrost, albo płeć i poziom zadowolenia ze swojej uczelni. Chcemy dowiedzieć się, czy kobiety i mężczyźni różnią się od siebie jakimś poziomem, mamy więc dwie grupy które porównujemy ze względu na jakąś cechę. Kto śledził nasze poradniki, ten wie, że mamy tu dwie zmienne: jedną w postaci kategorii, jedną w postaci cyfr. I to jest grupa testów tzw. międzygrupowych w których będziemy porównywać (zazwyczaj) jakieś średnie. Będziemy o tym pisać jeszcze kilka postów, bo temat jest szerszy. Ale to także nie są powtarzane pomiary.

ALE JA MAM JAKOŚ TAK INACZEJ SMUTNAZABA.PNG

No właśnie, jest coś co się wymyka powyższym ustaleniom. Na przykład ktoś może powiedzieć „ale ja mam tylko jedną zmienną”. Bo na przykład jeśli mamy tylko wzrost to jest jedna zmienna. Kluczem jest kwestia tego, czy tę jedną zmienną zmierzyliśmy tylko raz czy kilka razy. Mierzyliśmy wzrost dzieci w pierwszej klasie i potem tym samym dzieciom zmierzyliśmy wzrost w klasie drugiej. Niby mamy jedną zmienną, ale… dwa razy. Mamy dwa pomiary tej samej zmiennej.

Co ważne – nie ma tu grup. Nie porównujemy wzrostu między dziećmi z klasy A i z klasy B, tylko badamy te same dzieci dwa razy. Oto idea testów z tzw. powtarzanym pomiarem – badamy to samo, na tych samych badanych, ale więcej niż jeden raz. Albo – mierzymy ciśnienie badanym, serwujemy im trzy kawy i mierzymy ciśnienie po raz drugi. Chcemy sprawdzić czy pod wpływem kawy ciśnienie wzrasta (oby!). Nie porównujemy grupy która nie piła kawy z grupą która kawę piła, tylko dwa razy badamy tych samych ludzi.

W tzw. planach z powtarzanym pomiarem badacz może z różnych przyczyn sprawdzać jak jakaś zmienna pod wpływem czasu wzrasta lub maleje, ale nie porównujemy tu jak w eksperymentach odmiennych grup, tylko cały czas badamy te same osoby. Wady i zalety takich planów badawczych to oczywiście temat na parę rozdziałów mądrych książek do metodologii, ale nie będziemy nad nimi rozprawiać. Grunt żeby rozumieć, że w tego typu badaniach mamy kolejne „pomiary”.

To jak rozumieć powtarzany pomiar jest różnie tłumaczone, bo jest trochę zamieszania w opisie tego „co wpływa na co”, albo klasycznego podziału na zmienną zależną czy niezależną. Na przykład można rozumieć, że jakiś zmierzony wynik ulega zmianie pod wpływem czasu, więc czas jest czynnikiem wpływu. Możemy też rozumieć, że pomiędzy poszczególnymi pomiarami tej samej cechy jest jakieś działanie – podanie kawy badanym, trening jogi, czy cokolwiek innego. Wówczas czynnik wpływu to po prostu jakieś działanie eksperymentalne które ma za zadanie „zmienić” stan osób badanych. Niezależnie jednak od tego co jest pomiędzy pomiarami, mamy zawsze dwie te same kwestie: badamy te same osoby dwa lub więcej razy oraz mierzymy im tę samą cechę. My proponujemy w opisie swoich wyników dla testów z powtarzanym pomiarem słowa raczej unikać „wpływ”, a już zupełnie unikać zapisywania która zmienna to zależna a która niezależna, ale to takie nasze gadanie, nie bierz specjalnie do siebie.

Definicyjnie – jeśli mamy kolejne pomiary w obrębie tej samej grupy, to nazywa się je pomiarami zależnymi (w innych wersjach na przykład planami z powtarzanym pomiarem) a dane zebrane w takim badaniu nazywa się danymi zależnymi, danymi wewnątrzgrupowymi, planami wewnątrzobiektowymi, albo po prostu powtarzanymi pomiarami. Trochę słabo, że mówi się na to na różne sposoby, bo przecież jak jest jedna nazwa to łatwiej to kupić w spożywczaku, albo znaleźć na półkach Rossmana…

TO SIĘ TROCHĘ WYMYKA POWYŻSZEMU PODZIAŁOW

Jest to prawdą, prawdą to jest. W najprostszej wersji nie mamy w ogóle podgrup badawczych w których chcemy porównywać jakąś cechę, tylko pomiar na tej samej grupie kilka razy. Stąd kłopot w przyporządkowaniu takich badań do grupy testów chi-kwadrat, korelacji/regresji czy różnic międzygrupowych. Zazwyczaj jednak wciska się te badania z powtarzanym pomiarem do tej trzeciej grupy. Dlaczego? Głównie chodzi o wyobrażenie sobie jak zaprezentowalibyśmy wyniki. Kiedy porównujemy energię poranną kobiet i mężczyzn to prezentacja wyników w większości przypadków może zostać wykonana na dwóch słupkach ze średnimi (czy czymś analogicznym). Mamy jeden słupek dla kobiet, jeden dla mężczyzn, wysokość słupka to średni poziom energii w grupie i nasze wyobrażenie to określenie z grubsza który słupek jest wyższy.

Podobnie jest z powtarzanymi pomiarami – jeśli porównujemy poziom porannej energii studentów z ich popołudniową energią, to mamy tak samo dwa słupki. Grupa jest ta sama, ale słupki są dwa – jeden to słupek z energią poranną, drugi to słupek z energią popołudniową. Czek diz ałt:

Drugi powód wstawiania tych testów do grupy porównań jest taki, że analizy statystyczne wykonywane są z użyciem testów analogicznych do porównań międzygrupowych. W końcu porównujemy jakieś tam słupki, więc metoda jest zbliżona. I tak na przykład tam gdzie porównujemy dwie grupy możemy zastosować test t-Studenta dla dwóch grup, a tam gdzie porównujemy dwa pomiary mamy odpowiednik tego testu, czyli t-Studenta dla danych zależnych. Testy tam gdzie mamy grupy, zwykle chodzi o tzw. różnice międzygrupowe; tam gdzie mamy powtarzane pomiary mamy analogiczne testy dla danych zależnych bo chodzi o różnice między pomiarami.

GRUNT TO POLICZYĆ ILE TYCH POMIARÓW BYŁO

Jeśli już jesteśmy świadomi, że powtarzaliśmy pomiary w tej samej grupie, to w ogóle blisko końca i nasz trud jest skończony. Wiemy, że nasz plan badawczy to plan z powtarzanym pomiarem i to już będzie determinować kwestię tego z jakiej podgrupy będziemy dalej wybierać test. Następnie od policzenia tych powtarzanych pomiarów zaczyna się w ogóle przygoda z planami dla danych zależnych. Nie powinno to być specjalnie trudne, zwykle po prostu patrzymy w zebrane wyniki, albo zastanawiamy się nad tym jakie badanie przeprowadziliśmy. Zazwyczaj pamiętamy ile razy powtórzyliśmy daną czynność, a jak nie pamiętamy to możemy zerknąć w zebrane wyniki: na przykład ile razy zbadaliśmy u naszych badanych jakąś cechę. Jeśli zbadaliśmy poziom energii porannej tylko raz, to raczej nie powinniśmy myśleć o jakichś powtarzanych pomiarach. Powinno być ich minimum dwa. Zbadaliśmy poziom energii porannej, a potem wieczornej? Mamy dwa pomiary energii. Zbadaliśmy je dodatkowo w weekend? No to chyba już jasne że trzy.

Trudniejszy przykład? Powiedzmy, że zmierzyliśmy IQ badanych tak po prostu, bez żadnego działania, jako punkt odniesienia. Potem trenowaliśmy z nimi jogę, bo wierzymy że joga poprawia intelekt. Zmierzyliśmy jeszcze raz po tygodniu. Ale przyszło nam do głowy, że joga może poprawiać intelekt na dłuższą metę w czasie… więc zbadaliśmy jeszcze raz po dwóch tygodniach. Przerwaliśmy treningi i poczekaliśmy miesiąc. Znów zmierzyliśmy. Mamy więc ile? No, jasne że zgadliście! Cztery! Cztery powtarzane pomiary! Poziom bazowy, po tygodniu treningu, po dwóch tygodniach treningu i po miesiącu. Ile jest powtarzanych pomiarów? Powtarzamy: cztery!

Chyba nie jest to specjalnie skomplikowane?

JUŻ JESTEŚ BLIŻEJ NIŻ DALEJ, SŁYSZYSZ W TLE „KOLOROWY WIATR”

Jeśli udało Ci się ogarnąć że masz plan z powtarzanym pomiarem; oraz policzyć ile masz tych pomiarów to w zasadzie masz dwie opcje. Z tych dwóch opcji wybierzesz jaki test statystyczny powinien zostać wykonany żeby opisać wyniki Twojego badania. Rozpoczęliśmy już wcześniej opisywać czym jest algorytm wyboru testu statystycznego i dlaczego jest to ważne żeby wiedzieć co i jak się wybiera, żeby wybrać dobrze. Jak wybrać mądrze, życia nie przegrać… Tutaj, klik, jest podstawa wyboru testu statystycznego i opis tego jak działa „decydowanie” co policzyć i jak to przedstawić. Taka tabelka powinna Ci się wyświetlić, dobrze by było ją pamiętać, albo (serio) przeczytać w/w wpis:

No i teraz tak: wybierasz grupę testów międzygrupowych, czyli grupę C. Następnie wybierasz testy dla danych zależnych, z tych powyżej interesować Cię będą:

  • dla dwóch powtarzanych pomiarów test t-Studenta dla danych zależnych lub jego nieparametryczny odpowiednik Z Wilcoxona
  • dla trzech i więcej powtarzanych pomiarów test nazywany ANOVA dla danych zależnych (lub wewnątrzobiektowa ANOVA, albo ANOVA z powtarzanymi pomiarami) lub jej nieparametryczny odpowiednik test W Friedmana.

Niby proste, a trochę trudne. Niby trochę trudne, ale jakby się nad tym zastanowić to jednak proste.

Będzie jeszcze potrzebne wybranie między testem parametrycznym a nieparametrycznym, ale to opiszemy wkrótce.

PLANY MIESZANE – TROCHĘ CI NAMIESZAJĄ

Niby fajnie, wszystko jasne, ale nie do końca? No powiedzmy, że masz bardziej skomplikowany plan badawczy niż wszystkie wyżej wymienione. Powiedzmy, że owszem, masz powtarzane pomiary – chcesz sprawdzić czy energia studentów jest większa rano czy wieczorem (tak, dwa powtarzane pomiary), ale jednocześnie w swoim badaniu interesuje cię różnica międzypłciowa, a więc uwzględnienie czynnika grupującego. Masz więc zarówno powtarzany pomiar, jak i grupowanie ze względu na jakąś cechę. No to sprawa się rypła. Że to już nie jest proste normalnie.

Otóż to co zostało opisane powyżej nazywa się planem mieszanym, modelem mieszanym, albo mieszaną analizą wariancji (mixed ANOVA, mixed GLM model). Kłopot polega na tym, że ogarnięcie takich planów mieszanych to w zasadzie wyższy level ogarniania statystyki. I niestety, ogarnięcie tego w jakimś pojedynczym wpisie na blogu jest mało możliwe. To nie będzie ani prosta, ani przyjemna droga, bo za każdym rogiem będą czaić się wyboje.

Biedny studencina gaspodzina musi sobie czasem w życiu ciężkim radzić. Technicznie, jest to do ogarnięcia samodzielnie – znajdź książkę „Statystyczny drogowskaz 2. Praktyczne wprowadzenie do analizy wariancji” i przeczytaj. Możliwie całą. Ta książka krok po kroku przeprowadzi Cię przez różne kwestie związane z pomiarami międzygrupowymi, w tym przez plany mieszane. Raczej niemal pewne jest, że żeby to zrozumieć, ale tak naprawdę zrozumieć, trzeba przeczytać większość tej książki.

Możesz próbować znaleźć jakieś video na YT wpisując coś w stylu „how to perform mixed anova in SPSS” i przejrzeć co podpowiedzą Ci zagraniczni twardziele Youtube. Porozmawiaj też szczerze ze swoim przełożonym(ą)/promotorem(ką) i nie wahaj się powiedzieć, że to dość trudne. Bo taka jest prawda, jeśli czytasz tego bloga w poszukiwaniu odpowiedzi na temat tego jak wykonać model mieszany, to lekko nie będzie. Z drugiej strony – pamiętaj, zawsze znajdzie się ktoś, kto Ci to wyjaśni i pomoże.

Głowa do góry. Po prostu nie miej mieszanych planów a poradzisz sobie samodzielnie. 🙂 / :/ ^_^ UwU

…dobra, napiszemy o tym też.

<wróć