Çekirdek Yoğunluk Tahmininde Kullanılan Bant Genişliği Seçim Yöntemleri


ŞULE K., GÜNDÜZ N.

1st International Applied Statistics Conference (UYIK-2020), Tokat, Türkiye, 01 Ekim 2020, ss.274

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: Tokat
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.274
  • Gazi Üniversitesi Adresli: Evet

Özet

Çekirdek yoğunluk tahmin yöntemi, parametrik olmayan yoğunluk tahmini konusunda yaygın olarak kullanılan bir yöntemdir. Bilinmeyen olasılık yoğunluk fonksiyonu için çekirdek tahmin edicisi ile ilgili rasgele değişkene ilişkin olasılık yoğunluk yada dağılım fonksiyonu tahmininde bulunulur. Veriye dayalı olarak uygulanan bu tahmin yönteminde, çekirdek tahmin edicisinin performansı, düzgünleştirme parametresi olarak da bilinen bant genişliği parametresine bağlıdır. Bir başka ifade ile, bant genişliği, olasılık yoğunluk fonksiyonu yada dağılım fonksiyonu tahmininde önemli bir rol oynamaktadır. Örneğin, küçük bant genişlikleri dağılımın kuyruklarında pürüzler oluştururken, büyük bant genişlikleri dağılımın kuyruklarında aşırı düzleşme meydana getirerek dağılımın özelliklerini görmemizi sağlamaz. Çekirdek düzgünleştirmesinde kullanılan çeşitli bant genişliği seçim yöntemleri vardır. Bu çalışmanın amacı, basit bant genişliği seçimi (normal ölçek), yerine koyma ve en küçük kareler çapraz doğrulama gibi en yaygın olarak kullanılan bant genişliği seçme yöntemlerini incelemektir.

Kernel density estimation method is a widely used method for nonparametric density estimation. For the unknown probability density function, the probability density or distribution function of the related random variable is estimated by the kernel estimator. In this data-based estimation method, the performance of the kernel estimator depends on the bandwidth parameter, also known as the smoothing parameter. In other words, bandwidth plays an important role in the probability density function or distribution function estimation. For example, while small bandwidths create roughness in the tails of the distribution, large bandwidths do not allow us to see the properties of the distribution by creating excessive flattening in the tails of the distribution. There is various bandwidth selection methods used in kernel smoothing. The aim of this study is to examine most popular bandwidth selection methods such as the simple bandwidth selection (normal scale), plug-in and least square cross-validation.