Ogarniamy: operacjonalizacja zmiennych

25 października 2021 | author

Facebook

TL;DR: W tym rozdziale porozmawiamy o tym jak zmienić hipotezy w badaniu na wskaźniki – a to jest potrzebne do wyboru testu statystycznego.

Co się wydarzyło, że przybywasz tu po pomoc? Jakie wiatry przywiały Cię? Czy przed wyruszeniem w drogę należy zebrać drużynę? W te pytania nie będziemy się zagłębiać tu i teraz. Ważne jest, że my za chwilę chcemy na tym blogu uczyć Cię logiki wyboru testu statystycznego. A do tego potrzebne Ci są pewne podstawy. Pisaliśmy już o rozumieniu typów zmiennych. Teraz czas porozmawiać o hipotezach i przekładaniu ich na tzw. przestrzeń zmiennych (to takie coś co będziesz wykorzystywać przy wybieraniu testów statystycznych do swojej pracy). Od razu uprzedzamy – to może być najnudniejszy wpis na tym blogu, dlatego dorzuciliśmy trochę przerywników. No cóż – czasem trzeba zrobić krok ze ścieżki głównej żeby wykonać questa. Ale obiecujemy że na tym przyexpisz srogo.

O c b wgl? Po wykonaniu swojej pracy badawczej (klik oraz klik) czeka Cię to słynne w Śródziemiu “obliczenie wyników” lub “zrobienie statystyki” – czyli udowodnienie że wiesz co robisz i przedstawienie różnych cyferek potwierdzających że wiesz jak jest. Słowem – przed Tobą rozdział “wyniki”. Żeby ten rozdział zrobić (poprawnie) musisz (równie poprawnie) wybrać metody analizy swoich danych. W niektórych przypadkach nie wystarczy metoda “na oko”, czasem to jest bardziej złożone i powinien się tam pojawić jakiś test statystyczny. I spośród dużej ilości testów statystycznych musisz wybrać ten jeden, jedyny, prawdziwy i właściwy, pasujący do Ciebie, spędzicie przecież ze sobą resztę… eee… znaczy, musi być wybrany poprawnie.

WYBÓR TESTU DETERMINUJĄ: BRZMIENIE HIPOTEZY I ZMIENNE

Wybór testu determinują hipotezy i zmienne i do nich dobiera się metodę, odwrotne podejście przypomina dobieranie dziecka do zakupionego wózka. Jeśli trafisz, to nieźle, ale my tego nie zalecamy. O rozumieniu typów zmiennych pisaliśmy już, nie ma się co powtarzać. Teraz pogadajmy trochę o hipotezach. Ich treść, brzmienie i niektóre szczegóły wymuszają metodę statystyczną i w ogóle podejście badawcze. Porozmawiajmy o nich.

DOBRZE ŻEBY HIPOTEZY BYŁY MOŻLIWIE PROSTE

Hipotezy badawcze na poziomie studenckim powinny być proste – Wyobraź sobie że dopiero zaczynasz swoją pracę w kawiarni, masz małe doświadczenie (właściwie to Twoja pierwsza praca (dyplomowa, wiesz, metafora taka, pun intended)) i właśnie uczysz się rozróżniać kawę czarną od americano. I chcesz się popisać przed szefem (promotorem / recenzentem). Jak sądzisz, czy lepiej zrobić coś prostego najlepiej jak się da (cappuccino) czy od razu za pierwszym razem spróbować czegoś trudnego (dry lungo con panna maple latte art)? Być może lubisz ryzyko i w Twoim życiu wszystko się świetnie udaje za pierwszym razem, ale jeśli czujesz że jest jakieś ryzyko pogubienia się po drodze – wybierz prostotę. Wybierz coś co będzie łatwe do przełożenia na badania.

Hipotezy badawcze powinny od razu definiować przestrzeń zmiennych. Innymi słowy powinny bez wątpienia dla badacza (Ciebie) wskazywać co konkretnie było badane (a nawet jaką metodą!). Zwróć uwagę na to, jaką różnicę w klarowności hipotezy masz pomiędzy:

  • Kobiety zjadają miesięcznie więcej czekolady niż mężczyźni

a

  • Wpływ zamiłowania do słodyczy wywiera interioralną presję psychologiczną na podmiot determinując płciowo wielkość (numeryczną) ilości pożywienia słodkiego.

W pierwszym przypadku od razu wiadomo że chcesz porównać kobiety i mężczyzn pod względem ilości zjedzonej czekolady, w drugim… w drugim też, tylko przeczytaj sobie to kilka razy. 😉 Jeśli na etapie wyboru narzędzi badawczych i postawienia samych hipotez w pracy jesteś bliżej tej drugiej wersji – sprawdź czy wiesz co robisz. Pisaliśmy już o tym tutaj.

Umówmy się – w nauce ilość nie jest równa jakości. Najwspanialsze i najczęściej cytowane artykuły naukowe mają po kilka stron, a ich hipotezy oraz wnioski są prostymi konstruktami. Im praca jest na wyższym poziomie, tym w większym stopniu pomija to co zbędne i tym prostszym językiem się posługuje. Jest oczywiście wiele inspirujących cytatów w internecie o tym że wszystko da się wyrazić jakoś prosto… ale to oczywiście kwestia Twojego wyboru. My proponujemy Ci elegancką (i zawsze modną) prostotę.

OK, ALE CZEMU MĘCZYMY TE HIPOTEZY? MIELIŚMY MĘCZYĆ TESTY STATYSTYCZNE…

Żeby policzyć jakieś statystyki do pracy, trzeba najpierw ogarnąć co siedzi w hipotezach i jak przekładają się one na zmienne. No ale – wróćmy do hipotez i tego co wynika z nich dla statystyki w pracy. W każdej hipotezie musisz sobie rozpisać jakie zmienne w niej się pojawiają. O typach zmiennych pisaliśmy tutaj. Wróćmy do przykładu hipotezy z czekoladą:

  • Kobiety zjadają miesięcznie więcej czekolady niż mężczyźni

Mamy tu dwie zmienne – jedną jest płeć, płeć to kategorie, nie ma w środku cyferek, jest to zmienna jakościowa; drugą jest ilość zjedzonej miesięcznie czekolady, to będą jakieś cyferki, więc jest to zmienna ilościowa. Rozpiszmy sobie gdzieś z boku – płeć (jakość) i spożycie czekolady (ilość). Mamy dwie zmienne i wiemy jakiego są typu. Stąd już krok do wyboru testu (za tydzień).

Zadaliśmy sobie więc pytanie “co badam?”. Na etapie rozpisywania zmiennych musimy sobie zadać pytanie o to “jak to badam”. W przypadku czekolady można zapytać o ilość zjedzonych miesięcznie tabliczek, albo nieco precyzyjniej gram produktu. Ale niektóre zmienne mogą zostać określone poprzez użycie jakiegoś uprzednio zdobytego narzędzia. Przyjrzyjmy się przykładowi:

  • Wiek i osobowość są związane

W przypadku takiej ogólnej hipotezy pytanie “co badam” daje nam w odpowiedzi zmienną wiek i zmienną osobowość. Co do wieku – to proste, pytam badanego o lata, to zmienna ilościowa, cyfry. W przypadku osobowości trzeba zapytać “jak to badam”. Udzielając sobie odpowiedzi w postaci narzędzia do pomiaru osobowości, np. NEO-FFI wiemy, że mamy 5 zmiennych określających osobowość: neurotyczność, ekstrawersję, otwartość, ugodowość i sumienność; każda z tych zmiennych szczegółowych to wynik numeryczny, inaczej zmienna ilościowa. Razem w jednej hipotezie jest ujęte 6 zmiennych ilościowych.

Oczywiście można zadać pytanie, czy taka hipoteza nie jest zbytnim uproszczeniem? Z teorii powinno wynikać np. że wraz z wiekiem rośnie ugodowość – odnosimy się wówczas do dwóch konkretnych zmiennych ilościowych. Z drugiej strony jedna prosta hipoteza jest dla czytelnika zrozumiała i nie ma sensu rozpisywać osobno każdego ze związków. Anegdotka: znamy promotorkę która potrafi postawić ogólną hipotezę “osobowość wiąże się ze strategią radzenia sobie ze stresem” a potem rozpisywać każdy związek osobnej zmiennej kwestionariusza osobowości (5 wymiarów) z kwestionariuszem radzenia sobie ze stresem (14 wymiarów) wypisując listę 5 x 14 = 70 hipotez w pracy. No niech mi kierownik powie, kierowniczku, czy to sens ma, no ma? 😉 Apelujemy o rozwagę w miejscu pracy. Wróćmy jednak do złożoności hipotezy:

  • Ilość zjedzonej czekolady zależy od cech demograficznych

tu kwestię ilości czekolady mamy już ujętą – pojawia się pytanie czym są cechy demograficzne. W przypadku Twojej pracy musisz wypisać sobie cechy które udało Ci się zmierzyć: powiedzmy że to wiek, płeć i województwo. Wiek to zmienna numeryczna, ilościowa. Płeć to zmienna kategorialna, czyli jakościowa. Województwo, podobnie jak płeć to kategoria. Zatem wszystkie zmienne demograficzne mają różne postaci. Jeśli to różne typy zmiennych (w obrębie jednego konstruktu tematycznego: demografii, osobowości) to nie ma rady, trzeba tę hipotezę na początek rozpisać na trzy osobne analizy

  • ilość zjedzonej czekolady (ilościowa) x wiek (ilościowa)
  • ilość zjedzonej czekolady (ilościowa) x płeć (jakościowa)
  • ilość zjedzonej czekolady (ilościowa) x województwo (jakościowa)

A zatem masz trzy osobne przestrzenie zmiennych. Istnieją wprawdzie techniki łączenia tych wszystkich zmiennych ze sobą w postaci analizy interakcyjnej, ale nie rozmawiamy jeszcze o analizach, a o rozpisywaniu typów zmiennych, spokojnie, spokojnie, do wszystkiego dojdziemy.

Czasami jakiegoś rodzaju zmiennej musimy się częściowo domyślić. Na przykład

  • W Polsce to głównie mężczyźni palą.

Tu mamy przykład w którym możemy bardziej to czuć niż wiedzieć na pewno – chcemy sprawdzić czy kobiety i mężczyźni w populacji polskiej różnią się pod względem tego czy ktoś pali czy nie. Mamy więc kategorie, czyli zmienne jakościowe: płeć (mężczyzna vs kobieta) oraz palenie (pali x nie pali). Widzisz? To wszystko nie jest takie trudne jak się wydaje. Po prostu na spokojnie zastanów się nad brzmieniem i treścią tego co i jak zostało zbadane.

Poćwiczmy. Przyjrzyjmy się hipotezom i pytaniom badawczym i spróbujmy określić zmienne w ich obrębie. Pamiętaj żeby za każdym razem zapytać nie tylko “co” ale i “jak” zostało to zbadane. Określ przestrzeń zmiennych:

  • Wzrost w populacji zależy od kraju zamieszkania
  • Czy więcej kobiet czy mężczyzn lubi kolor zielony?
  • Dobrostan jednostki jest ściśle związany z poziomem dochodów.
  • W jakim mieście Polski zjada się najwięcej komosy ryżowej?
  • Czy osobowość i temperament determinują poczucie koherencji?
  • Sposób radzenia sobie ze stresem zależy od temperamentu.
  • Czy poziom jakości życia zależy od regionu Polski?

Oczywiście daj sobie tyle czasu ile potrzebujesz. Możesz do nas w każdej chwili napisać (np. na profilu FB) i sprawdzić czy udało Ci się poprawnie odpowiedzieć.

Podsumowując – poruszyliśmy tu kwestię przekładania hipotez i pytań badawczych na przestrzeń zmiennych. Będzie to nam potrzebne do nauki wyboru właściwego testu statystycznego. Liczymy, że do naszego następnego spotkania będziesz już biegle posługiwać się tą metodą. 🙂

Do zobaczenia za tydzień!

P.S. Na koniec przyjrzyjmy się też źle postawionej hipotezie:

  • Poziom wiedzy studentów w zakresie statystyki jest wysoki.

Tutaj opisujemy dlaczego to jest źle postawiona hipoteza i jej rozpisywanie nie ma większego sensu. Jeśli masz jakieś pytania i wątpliwości związane z tymi hipotezami, napisz do nas.

<wróć