Tezin Türü: Doktora
Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye
Tezin Onay Tarihi: 2019
Tezin Dili: Türkçe
Öğrenci: Ezgi NAZMAN
Danışman: SEMRA ERBAŞ
Özet:İkili lojistik regresyon (LR) yöntemi, yanıt değişkeni iki mümkün sonuca sahip olduğunda yaygın olarak kullanılan çok değişkenli istatistiksel bir yöntemdir. Örnek hacminin küçük ve ilgilenilen olayın nadir olduğu durumlarda LR yöntemi için en çok olabilirlik tahminleri tam olarak elde edilememektedir. Firth (1993), hem bu tahmin problemini hem de birinci mertebeden asimtotik yanlılığı ortadan kaldıran cezalandırılmış bir yöntem olarak Firth lojistik regresyon (FLR) yöntemini önermiştir. Daha sonra, FLR yöntemi kestirilen olasılıklara ilişkin sonuçlarda aşırı tahmine sebep olduğu için, Puhr ve diğerleri (2017) sabit terim düzeltmeli Firth lojistik regresyon (FLIC) yöntemini önermiştir. Öte yandan, ilgilenilen olay nadir iken açıklayıcı değişkenler arasında çoklu bağlantının olduğu durum için Shen ve Gao (2008) iki kat cezalandırılmış lojistik regresyon (DPLR) yöntemini önermişlerdir. Ancak, bu yöntem yine de kestirilen olasılıklarda aşırı tahmine sebep olmaktadır. Bu çalışmada, FLIC ve DPLR yöntemlerinden yola çıkarak sabit terim düzeltmeli iki kat cezalandırılmış lojistik regresyon (MDPLR) yöntemi yeni bir yaklaşım olarak önerilmiştir. MDPLR yöntemi ile LR, Ridge lojistik regresyon (RLR), FLR, DPLR, zayıflatılmış Firth lojistik regresyon (WFLR), FLIC ve eş değişken eklenmiş Firth lojistik regresyon (FLAC) yöntemleri parametreye ilişkin ortalama tahmin edilen yan, ortalama kestirilen olasılık yan, standart hatalar ve ortalama RMSE bakımından karşılaştırılmıştır. Modelde farklı sayıda açıklayıcı değişken olduğu durumlar ele alınarak, farklı örnek hacimleri ve farklı nadir olay oranlarına ek olarak çoklu bağlantının olduğu ve olmadığı durumlar için detaylı bir Monte Carlo simülasyon çalışması yürütülmüştür. Gözlemsel veriye dayalı ters koşullu dağılım kullanılarak ele alınan veri üretim yaklaşımı, literatürde ilk kez cezalandırılmış LR yöntemleri için kullanılmıştır. Ayrıca, gerçek bir veri seti ile simülasyon sonuçları değerlendirilmiştir. Sonuçlara göre, parametreye ilişkin istatistiksel çıkarsama yapmak için FLAC, DPLR ve MDPLR yöntemlerinin kullanılması ve kestirilen olasılık üzerine çalışmalar için FLIC, FLAC, RLR ve MDPLR yöntemlerinin kullanılması önerilmiştir