Projekt realizowany przez Instytut Badań Edukacyjnych z dofinansowaniem z Funduszy Europejskich dla Rozwoju Społecznego (FERS).

Instrukcje

Jak analizować dane z międzynarodowych porównawczych badań edukacyjnych za pomocą pakietów statystycznych?

W tej części opisujemy zasoby wspierające bardziej doświadczonych użytkowników w zrozumieniu specyfiki międzynarodowych badań edukacyjnych, efektywnym łączeniu i analizowaniu danych oraz przeprowadzaniu zaawansowanych analiz statystycznych z wykorzystaniem różnych pakietów statystycznych. Pokażemy, w jaki sposób można prowadzić analizy, korzystając z darmowych (R) lub komercyjnych pakietów statystycznych.

W pierwszej kolejności najlepiej jest zapoznać się z dostępną dokumentacją, raportami technicznymi z badań oraz podręcznikami użytkownika udostępnionymi wraz z danymi. Pomoże to w zorientowaniu się w specyfice badania, schemacie losowania próby i sposobie jego uwzględnienia w wagach analitycznych. Należy zwrócić szczególną uwagę na sposoby korzystania ze zmiennych dotyczących osiągnięć uczniów, a także zasady łączenia poszczególnych plików (np. zbiorów zawierających dane uczniów i zbiorów z danymi ich nauczycieli). Podczas przeprowadzania zaawansowanych analiz z wykorzystaniem różnych pakietów statycznych dobrze jest skorzystać z dostępnych narzędzi wspierających statystyczne analizy danych.

Narzędzia wspierające statystyczne analizy danych

Narzędzia do analizy międzynarodowych badań edukacyjnych 

Badania edukacyjne wymagają zaawansowanych narzędzi statystycznych, które uwzględniają złożone schematy próbkowania, wagi replikacyjne oraz wartości prawdopodobne (plausible values). Poniżej przedstawiamy przegląd oprogramowania statystycznego, które najlepiej sprawdza się w analizie danych z takich badań.

Najwygodniejszym narzędziem korzystania z tych danych jest oprogramowanie R. 

Użytkownicy popularnych pakietów statystycznych, takich jak SPSS, Stata czy SAS mogą korzystać z dodatkowych pakietów lub makr automatyzujących pracę z danymi z badań międzynarodowych.

IEA IDB Analyzer

IEA IDB Analyzer to darmowe narzędzie opracowane przez IEA, służące do analizy danych z międzynarodowych porównawczych badań edukacyjnych, takich jak te prowadzone przez IEA, OECD i inne organizacje. Oprogramowanie to pozwala na uwzględnienie specyfiki schematu badania oraz przeprowadzenie analiz w różnych pakietach statystycznych, w tym SPSS, SAS oraz R (wersja 4.2.0 lub wyższa). Do działania programu wymagany jest system operacyjny Windows oraz zainstalowane odpowiednie oprogramowanie statystyczne.

IEA IDB Analyzer wyposażony jest w graficzny interfejs użytkownika, który odczytuje zawartość plików danych z katalogu użytkownika i generuje składnię do łączenia i analizy danych w SPSS, SAS lub R. Składa się z trzech głównych modułów: Modułu Łączenia (Merge Module), Modułu Analizy (Analysis Module) oraz nowego modułu w wersji 5.0, który umożliwia konwersję plików systemowych SPSS na pliki danych R. Moduł Łączenia umożliwia tworzenie składni do łączenia plików z różnych krajów i poziomów (np. uczniów, nauczycieli, szkół), natomiast Moduł Analizy pozwala na generowanie składni do przeprowadzania analiz na tych danych. Wygenerowany kod umożliwia użytkownikowi przeprowadzanie analiz statystycznych, w tym obliczanie statystyk opisowych, testowanie hipotez oraz wykonywanie  prostych modeli regresji liniowej i logistycznej.

Więcej informacji na temat IEA IDB Analyzer znajduje się tutaj.


R (język programowania)

Darmowe, otwarte oprogramowanie oferujące szeroki zakres zaawansowanych narzędzi analitycznych. Dzięki bogatej bibliotece pakietów jest szczególnie przydatny do analizy danych z badań edukacyjnych.

Polecane pakiety:

IDB Analyzer 

  • Umożliwia tworzenie i eksport skryptów do łączenia danych i podstawowych analiz danych z badań. 

BIFIEsurvey

  • Kompleksowa analiza danych edukacyjnych.
  • Obsługa złożonych schematów losowania i wartości prawdopodobnych.
  • Analiza wielopoziomowa.

EdSurvey

  • Specjalnie zaprojektowany do międzynarodowych badań porównawczych.
  • Obsługuje złożone struktury próbkowania oraz wagi replikacyjne.
  • Umożliwia zaawansowane modelowanie statystyczne (metody Jackknife i BRR).

Intsvy

  • Proste narzędzie do analiz danych z PISA, TIMSS i PIRLS.
  • Umożliwia statystyki opisowe i modelowanie.
  • Odpowiedni dla mniej złożonych analiz.

SPSS 

Popularny komercyjny pakiet statystyczny powszechnie stosowany do analizy danych z badań społecznych.  

Nie umożliwia bezpośrednio analizy danych zawierających wartości prawdopodobne (plausible values) oraz wagi replikacyjne. Ich uwzględnienie wymaga dodatkowych makr lub wykorzystania oprogramowania IDB Analyzer.

Stata

Stata to zaawansowany, komercyjny pakiet statystyczny, który jest ceniony ze względu na intuicyjność i wszechstronność w analizach badań społecznych.

Funkcja svyset umożliwia definiowanie schematów próbkowania, wag oraz metod replikacji. Stata nie obsługuje bezpośrednio wartości prawdopodobnych (plausible values), które są kluczowe w analizie danych. Można z nich korzystać pośrednio, używając funkcjonalności do pracy ze zbiorami imputacyjnymi lub po zainstalowaniu dodatkowych pakietów.

Polecane pakiety:

Repest

  • Predefiniowane schematy badań. 
  • Analiza danych z wagami replikacyjnymi.
  • Duża elastyczność w analizach wielopoziomowych.

pv

  • Dedykowany moduł do pracy z wartościami prawdopodobnymi.
  • Obsługa wielu zestawów zmiennych w złożonych badaniach.

SAS

Zaawansowany, komercyjny pakiet statystyczny do analizy danych z badaniach społecznych i edukacyjnych.

Procedury SURVEY umożliwiają obsługę danych złożonych schematów próbkowania. Wartości prawdopodobne można uwzględnić, korzystając z procedur dedykowanych do pracy z imputowanymi danymi. Do uśrednienia wyników można też wykorzystać makra.

Mplus

Komercyjny pakiet statystyczny zawierający funkcjonalności z zakresu psychometrii, analiz wielopoziomowych przydatne w analizie danych edukacyjnych.  Wartości prawdopodobne można uwzględnić korzystając z procedur do pracy z imputowanymi danymi.