Fehlende Daten in der Bildungsforschung
Federführung: IPN
Kooperation mit: DIPF
Aktuelle Projektmitglieder: IPN | Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik (Prof. Dr. Oliver Lüdtke➚, Dr. Simon Grund➚, Dr. Alexander Robitzsch➚)
Fehlende Daten („Missing Data“) stellen in der Bildungsforschung eine große Herausforderung dar und sind mit drei Problemen bei der Datenauswertung verbunden. Erstens führt die aufgrund des Datenausfalls reduzierte Stichprobengröße zu einer größeren Unsicherheit bei der Parameterschätzung. Zweitens wird der Umgang mit den Daten erschwert, weil viele statistische Verfahren vollständige Datensätze erwarten. Drittens besteht die Gefahr verzerrter Parameterschätzungen, weil systematische Unterschiede zwischen den beobachteten und den fehlenden Daten vorliegen könnten. Eine mögliche Lösung bietet das Verfahren der multiplen Imputation. Bei diesem Verfahren werden auf der Grundlage eines Imputationsmodells mehrere Ersetzungen für die fehlenden Daten in einem Datensatz erzeugt, die die mit der Ersetzung verbundene Unsicherheit berücksichtigen.
Das vorliegende Projekt befasst sich mit der Optimierung der Behandlung von fehlenden Daten in der Forschungspraxis und der Auswertung von Large-Scale Assessments. Im Mittelpunkt steht die Entwicklung leicht einzusetzender Software, mit der sowohl eine flexible Imputation von fehlenden Werten durchgeführt als auch statistische Inferenz für die multipel imputierten Daten vorgenommen werden kann. Insgesamt soll das Projekt somit ermöglichen, das analytische Potential von groß angelegten Schulleistungsstudien besser auszuschöpfen, indem einem breiten Kreis von Anwender*innen ein adäquater Umgang mit fehlenden Daten auch in komplexen Datensätzen ermöglicht werden wird.