Çok değişkenli veride aykırı gözlemlerin tespiti için en küçük kovaryans determinantına dayalı test istatistiğinin 1. tip hata bakımından sağlamlığının irdelenmesi


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2013

Öğrenci: EREN GÜMÜŞ

Danışman: OSMAN UFUK EKİZ

Özet:

Çok değişkenli veri analizinde aykırı gözlemleri tespit etmek, özellikle veri çapı arttığında oldukca zordur. Ayrıca aykırı gözlemler, klasik konum ve dağılış parametre tahminlerini ve dolayısı ile aykırı gözlemleri belirlemekte kullanılan Mahalanobis uzaklık ölçüsünü de etkilemektedir. Bu nedenle Mahalanobisuzaklık olcusunde aykırı gözlemlere karsı sağlam tahmin ediciler kullanılması daha uygun görülmektedir. Çok değişkenli verinin konum ve dağılış parametrelerinin En Küçük Kovaryans Determinantı tahmin edicileri, literaturde yer alan aykırı gözlemlere karsı sağlam tahmin edicilerden sadece biridir. Bu çalışmanın amacı, En Küçük Kovaryans Determinantı tahminlerine dayalı sağlam Mahalanobis uzaklıklarının dağılımına ilişkin yaygın olarak kullanılan ki-kare dağılımının aksine, aykırı gözlemlere karşılık gelen uc Mahalanobis uzaklıklar için F dağılımının daha uygun olduğu yönündeki çalışmaların sonuçlarını, simulasyon yolu ile irdelemektir. Bu çalışmada öncelikle aykırı değer ve sağlam istatistik kavramları üzerinde durulmus, daha sonra En Küçük Kovaryans Determinantı yönteminden bahsedilmistir. En Kucuk Kovaryans Determinantı yonteminin hesaplama zorluğundan dolayı, Hızlı-En Kucuk Kovaryans Determinantı yönteminin algoritmasından bahsedilmis ve simulasyon calısması bu algoritma üzerinden gerceklestirilmistir. Simulasyon calısmasında ki-kare ve F dağılımları üzerinden yanlış belirleme oranları karşılaştırılmış ve sonuçlar görsel olarak desteklenmiştir. Sonuc olarak, cok değiskenli veride MCD tahminlerine dayalı sağlam Mahalanobis uzaklıkları uzerinden aykırı gozlem tespit etmede yaygın olarak kullanılan ki-kare kritik değerinin aksine, F dağılımına ilişkin kritik değerin kullanılmasının uygun olacağı düşünülmektedi .