Lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesi ve etkililiklerinin incelenmesi


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2011

Öğrenci: MUSTAFA SELÇUK YAVUZKANAT

Danışman: MEHMET AKİF BAKIR

Özet:

Regresyon, bağımlı değişken ile bir veya daha çok bağımsız değişken arasındaki ilişkiyi incelemek amacıyla kullanılan bir analiz yöntemidir. Regresyon analizinde bağımlı değişken genellikle sürekli ve ölçülebilir alınır. Ancak bazı durumlarda bağımlı değişken kesiklidir ve sadece iki uçlu değerler alabilir. Böyle durumlarda bağımlı değişken Binom olasılık dağılımına sahip olacağından regresyon modelini bir olasılık modeli olarak kurmak gerekir. Bu bağlamda regresyon modeli lojistik dağılım fonksiyonuna dayalı olarak yazılabilir. Doğrusal regresyon modellerinde olduğu gibi, lojistik regresyon modellerinde de veri kümesi uzayının uçlarında yer alan noktalar olabilir. Aykırı gözlem olarak bilinen bu gözlemlerin belirlenmesi ve regresyon fonksiyonunun uyum iyiliği ve/veya parametre tahminleri üzerine etkisi olup olmadığının irdelenmesi gerekir. Aykırı gözlemlerin belirlenmesine yönelik bazı tek gözlem yöntemleri geliştirilmiştir. Uygulamada sıkça rastlanan yaklaşım, aykırı gözlemlerin bu türden yöntemlerle incelenmesidir. Ancak maskeleme (masking) ve sahte aykırı gözlem (swamping) problemi söz konusu olduğunda tek gözlem yöntemleri başarısız olur. Bu nedenle bu problemlerden etkilenmeyecek bir yönteme ihtiyaç duyulmaktadır. Bu çalışmada, lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesinde etkili bir şekilde kullanılabilecek olan Genelleştirilmiş Standart Pearson Artıkları (GSPR) yöntemi Türkiye 2009 Elit Bayan Voleybol ligine ve firma iflaslarına ilişkin verilere uygulanarak yöntemin etkin biçimde çalıştığı ve maskeleme etkisini giderdiği gösterilmiştir.