Projekt realizowany przez Instytut Badań Edukacyjnych w ramach programu Fundusze Europejskie dla Rozwoju Społecznego (FERS).

Instrukcje

Jak analizować dane z międzynarodowych porównawczych badań edukacyjnych za pomocą pakietów statystycznych?

8 DATA shutterstock 2137085889

W tej części opisujemy zasoby wspierające bardziej doświadczonych użytkowników w zrozumieniu specyfiki międzynarodowych badań edukacyjnych, efektywnym łączeniu i analizowaniu danych oraz przeprowadzaniu zaawansowanych analiz statystycznych z wykorzystaniem różnych pakietów statystycznych. Pokażemy, w jaki sposób można prowadzić analizy, korzystając z darmowych (R) lub komercyjnych pakietów statystycznych.

W pierwszej kolejności najlepiej jest zapoznać się z dostępną dokumentacją, raportami technicznymi z badań oraz podręcznikami użytkownika udostępnionymi wraz z danymi. Pomoże to w zorientowaniu się w specyfice badania, schemacie losowania próby i sposobie jego uwzględnienia w wagach analitycznych. Należy zwrócić szczególną uwagę na sposoby korzystania ze zmiennych dotyczących osiągnięć uczniów, a także zasady łączenia poszczególnych plików (np. zbiorów zawierających dane uczniów i zbiorów z danymi ich nauczycieli). Podczas przeprowadzania zaawansowanych analiz z wykorzystaniem różnych pakietów statycznych dobrze jest skorzystać z dostępnych narzędzi wspierających statystyczne analizy danych.

Narzędzia wspierające statystyczne analizy danych

Narzędzia do analizy międzynarodowych badań edukacyjnych 

Badania edukacyjne wymagają zaawansowanych narzędzi statystycznych, które uwzględniają złożone schematy próbkowania, wagi replikacyjne oraz wartości prawdopodobne (plausible values). Poniżej przedstawiamy przegląd oprogramowania statystycznego, które najlepiej sprawdza się w analizie danych z takich badań.

Najwygodniejszym narzędziem korzystania z tych danych jest oprogramowanie R. 

Użytkownicy popularnych pakietów statystycznych, takich jak SPSS, Stata czy SAS mogą korzystać z dodatkowych pakietów lub makr automatyzujących pracę z danymi z badań międzynarodowych.

IEA IDB Analyzer

IEA IDB Analyzer to darmowe narzędzie opracowane przez IEA, służące do analizy danych z międzynarodowych porównawczych badań edukacyjnych, takich jak te prowadzone przez IEA, OECD i inne organizacje. Oprogramowanie to pozwala na uwzględnienie specyfiki schematu badania oraz przeprowadzenie analiz w różnych pakietach statystycznych, w tym SPSS, SAS oraz R. Do działania programu wymagany jest system operacyjny Windows oraz zainstalowane odpowiednie oprogramowanie statystyczne.

IEA IDB Analyzer wyposażony jest w graficzny interfejs użytkownika, który odczytuje zawartość plików danych z katalogu użytkownika i generuje składnię do łączenia i analizy danych w SPSS, SAS lub R. Składa się z trzech głównych modułów: Modułu Łączenia (Merge Module), Modułu Analizy (Analysis Module) oraz nowego modułu w wersji 5.0, który umożliwia konwersję plików systemowych SPSS na pliki danych R. Moduł Łączenia umożliwia tworzenie składni do łączenia plików z różnych krajów i poziomów (np. uczniów, nauczycieli, szkół), natomiast Moduł Analizy pozwala na generowanie składni do przeprowadzania analiz na tych danych. Wygenerowany kod umożliwia użytkownikowi przeprowadzanie analiz statystycznych, w tym obliczanie statystyk opisowych, testowanie hipotez oraz wykonywanie  prostych modeli regresji liniowej i logistycznej.

Więcej informacji na temat IEA IDB Analyzer znajduje się tutaj.


R

R to darmowe, otwarte oprogramowanie oferujące zaawansowane narzędzia analityczne, dostępne w dodatkowych pakietach. Po załadowaniu do środowiska R pakiety te rozszerzają jego możliwości o nowe funkcje. Istnieją pakiety umożliwiające m.in. uwzględnienie w analizach schematu doboru próby, wag analitycznych i replikacyjnych oraz wartości prawdopodobnych, a także dokonywanie porównań międzykrajowych. Pakiety różnią się funkcjonalnością i poziomem zaawansowania, co pozwala dostosować narzędzia do indywidualnych potrzeb użytkowników.

Polecane pakiety:

IDB Analyzer 

Umożliwia tworzenie i eksport skryptów do łączenia danych i podstawowych analiz danych z badań.

więcej  

EdSurvey

Specjalnie zaprojektowany na potrzeby analizy danych z międzynarodowych badań porównawczych.


więcej  

Rrepest

Zaprojektowany przez analityków OECD na potrzeby analizy danych z międzynarodowych badań edukacyjnych.

więcej  

Intsvy

Proste narzędzie do analizy danych z badań PISA, TIMSS i PIRLS


więcej  

BIFIEsurvey

Wszechstronny pakiet, opracowany pod kątem analizy danych z różnych badań ze złożonymi schematami losowania, wagami replikacyjnymi i wartościami prawdopodobnymi.

więcej  

SPSS 

Popularny komercyjny pakiet statystyczny powszechnie stosowany do analizy danych z badań społecznych.  

Nie umożliwia bezpośrednio analizy danych zawierających wartości prawdopodobne (plausible values) oraz wagi replikacyjne. Ich uwzględnienie wymaga dodatkowych makr lub wykorzystania oprogramowania IDB Analyzer.

Stata

Stata to zaawansowany, komercyjny pakiet statystyczny, który jest ceniony ze względu na intuicyjność i wszechstronność w analizach badań społecznych.

Funkcja svyset umożliwia definiowanie schematów próbkowania, wag oraz metod replikacji. Stata nie obsługuje bezpośrednio wartości prawdopodobnych (plausible values), które są kluczowe w analizie danych. Można z nich korzystać pośrednio, używając funkcjonalności do pracy ze zbiorami imputacyjnymi lub po zainstalowaniu dodatkowych pakietów.

Polecane pakiety:

Repest

  • Predefiniowane schematy badań. 
  • Analiza danych z wagami replikacyjnymi.
  • Duża elastyczność w analizach wielopoziomowych.

pv

  • Dedykowany moduł do pracy z wartościami prawdopodobnymi.
  • Obsługa wielu zestawów zmiennych w złożonych badaniach.

SAS

Zaawansowany, komercyjny pakiet statystyczny do analizy danych z badaniach społecznych i edukacyjnych.

Procedury SURVEY umożliwiają obsługę danych złożonych schematów próbkowania. Wartości prawdopodobne można uwzględnić, korzystając z procedur dedykowanych do pracy z imputowanymi danymi. Do uśrednienia wyników można też wykorzystać makra.

Mplus

Komercyjny pakiet statystyczny zawierający funkcjonalności z zakresu psychometrii, analiz wielopoziomowych przydatne w analizie danych edukacyjnych.  Wartości prawdopodobne można uwzględnić korzystając z procedur do pracy z imputowanymi danymi.