Örneklemede ağırlıklandırma prosedürleri ve kalibrasyon yaklaşımı


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2020

Tezin Dili: Türkçe

Öğrenci: CENKER BURAK METİN

Danışman: YAPRAK ARZU ÖZDEMİR

Özet:

Örnekleme yöntemleri kullanılarak yapılan araştırmalarda hedef yığın ilgilenilen karakteristikler için en iyi şekilde temsil edilmelidir. Temsil sorunu ile karşılaşmamak ve parametreleri etkin biçimde tahmin etmek için hedef yığını olabildiğince kapsayan bir örnekleme çerçevesi oluşturulmalıdır. Bu çerçeve kullanılarak birimlerin seçim olasılıklarının farklı olduğu durumlarda tasarım ağırlıklarının kullanımını gerektiren örnekleme tasarımları geliştirilir. Cevapsızlık, kapsamdışılık gibi sorunların tasarım ağırlıklarında olumsuz etkisini azaltmak amacıyla bazı düzeltme işlemleri yapılır. Kalibrasyon yaklaşımı, yardımcı bilgi kullanarak bilinen yığın değerlerine uyum sağlayan bir ağırlıklandırma işlemidir. Bu tez çalışmasındaki amaç, aykırı değer, aykırı ağırlık ve farklı korelasyon yapılarının olduğu büyük veri setlerinde kullanılabilecek ağırlıklandırma ve kalibrasyon işlemlerinin etkinliklerinin araştırılmasıdır. Bu durumlarda genellikle ağırlık budaması kullanılarak sorunlar giderilmektedir. Bu çalışmada, ağırlık budamasına alternatif olarak uygulamada kullanımı daha kolay olan minimum uzaklık yöntemlerinden sınırlandırılmış kalibrasyon tahmin edicileri incelenmiştir. Ayrıca yardımcı değişkenlerin korelasyon yapısının kalibrasyon tahmin edicilerinin etkinliklerini ne düzeyde etkilediği de araştırılmıştır. Simülasyon çalışması yapılarak, ele alınan tahmin edicilerin etkinlikleri farklı korelasyon yapıları ve aykırı değer durumları için elde edilmiştir. Simülasyon çalışması sonucunda, kalibrasyon tahmin edicilerinin Horvitz-Thompson tahmin edicisinden daha etkin olduğu; yardımcı değişkenlerin hedef değişkenle korelasyonu arttığında etkinliğin belirgin biçimde arttığı gözlemlenmiştir. Bunlara ek olarak hedef ve yardımcı değişkenlerde aykırı değerler olduğunda, kalibrasyon tahmin edicilerinin göreli etkinliğinin sorunsuz veri setlerine göre çok daha büyük olduğu da belirlenmiştir. Tezin uygulama kısmında ise 2017 Yıllık Sanayi ve Hizmet İstatistikleri verisi kullanılmış ve "Ciro" gibi varyansı yüksek olan değişkenlerin tahmininde sınırlandırılmış kalibrasyon tahmin edicilerinin Genelleştirilmiş regresyon tahmin edicisinden daha etkin oldukları tespit edilmiştir. Özellikle küçük örnekleme oranlarında, kalibrasyon işlemi sonrasında karşılaşılan negatif ve birden küçük ağırlık sorununu çözme konusunda sınırlandırılmış kalibrasyon tahmin edicilerinin, ağırlık budaması ile elde edilen tahmin edicilerden daha etkin sonuçlar verdiği belirlenmiştir.