Wybrane statystyczne metody radzenia sobie z brakami danych
Streszczenie
W artykule przedstawiono wybrane współczesne statystyczne metody radzenia sobie z brakami danych. Artykuł opiera się na podejściu Rubina, który zaproponował trzy typy mechanizmów generujących braki danych: mechanizm całkowicie losowy (MCAR: Missing completely at random), mechanizm losowy (MAR: Missing at random), mechanizm nielosowy (MNAR: Missing not at random). Przedstawione i ocenione zostały zarówno klasyczne, jak i „nowoczesne” metody radzenia sobie z brakami danych, takie jak: usuwanie braków danych, zastępowanie średnią, imputacja regresyjna, stochastyczna imputacja regresyjna, nieparametryczna imputacja hot deck, metoda największej wiarygodności uwzgledniająca braki danych i wielokrotne imputacje. Artykuł kończy się praktycznymi wskazówkami dotyczacymi radzenia sobie z brakami danych.