Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye
Tezin Onay Tarihi: 2013
Öğrenci: EREN GÜMÜŞ
Danışman: OSMAN UFUK EKİZ
Özet:Çok değişkenli veri analizinde aykırı gözlemleri tespit etmek, özellikle veri çapı arttığında oldukca zordur. Ayrıca aykırı gözlemler, klasik konum ve dağılış parametre tahminlerini ve dolayısı ile aykırı gözlemleri belirlemekte kullanılan Mahalanobis uzaklık ölçüsünü de etkilemektedir. Bu nedenle Mahalanobisuzaklık olcusunde aykırı gözlemlere karsı sağlam tahmin ediciler kullanılması daha uygun görülmektedir. Çok değişkenli verinin konum ve dağılış parametrelerinin En Küçük Kovaryans Determinantı tahmin edicileri, literaturde yer alan aykırı gözlemlere karsı sağlam tahmin edicilerden sadece biridir. Bu çalışmanın amacı, En Küçük Kovaryans Determinantı tahminlerine dayalı sağlam Mahalanobis uzaklıklarının dağılımına ilişkin yaygın olarak kullanılan ki-kare dağılımının aksine, aykırı gözlemlere karşılık gelen uc Mahalanobis uzaklıklar için F dağılımının daha uygun olduğu yönündeki çalışmaların sonuçlarını, simulasyon yolu ile irdelemektir. Bu çalışmada öncelikle aykırı değer ve sağlam istatistik kavramları üzerinde durulmus, daha sonra En Küçük Kovaryans Determinantı yönteminden bahsedilmistir. En Kucuk Kovaryans Determinantı yonteminin hesaplama zorluğundan dolayı, Hızlı-En Kucuk Kovaryans Determinantı yönteminin algoritmasından bahsedilmis ve simulasyon calısması bu algoritma üzerinden gerceklestirilmistir. Simulasyon calısmasında ki-kare ve F dağılımları üzerinden yanlış belirleme oranları karşılaştırılmış ve sonuçlar görsel olarak desteklenmiştir. Sonuc olarak, cok değiskenli veride MCD tahminlerine dayalı sağlam Mahalanobis uzaklıkları uzerinden aykırı gozlem tespit etmede yaygın olarak kullanılan ki-kare kritik değerinin aksine, F dağılımına ilişkin kritik değerin kullanılmasının uygun olacağı düşünülmektedi .