Makine Öğrenmesi Algoritmaları ile TÜFE Verilerinde Aykırı Değer Tespiti


Dikbaş Ü., Ebegil M.

Zeki sistemler teori ve uygulamaları dergisi (Online), cilt.9, sa.2026, ss.1-13, 2026 (TRDizin) identifier

Özet

Veri süreçlerindeki olağandışı durum ve gözlemlerin tespit edilmesi süreçlerin iyileştirilmesi, güçlendirilmesi, yapılacak olan analizlerden ve tahminlerden daha doğru sonuç alınabilmesi gibi çeşitli sebeplerden ötürü oldukça önem arz etmektedir. Bu nedenle, verilerde aykırı değerlerin belirlenmesi gerek araştırmacıların gerekse uygulamacıların son yıllarda yoğun bir şekilde üzerinde durduğu önemli bir konu haline gelmiştir. Aykırı değer gözlemlerin tespit edilmesinde istatistiksel yöntemler olmakla birlikte makine öğrenmesi teknikleri de yer almaktadır. Çalışmanın temel amacı aykırı değer tespitinde geleneksel yöntemlerin yanı sıra makine öğrenme modellerinin de kullanabileceğini ve gerek istatistiksel yöntemlerle gerekse kendi aralarında tahmin performanslarının farklı olabileceğini ortaya koymaktır. Çalışmanın dolaylı amaçları ise bütün bu yöntemlerin makroekonomik zaman serilerinde aykırı gözlemleri tespit etmede yardımcı olabileceği ve aykırı olarak tespit edilen ilgili dönemlerin iktisadi çalışmalarda daha kapsamlı değerlendirilebileceğinin ortaya konulmasıdır. Çalışma kapsamında 2003Q2-2024Q4 Tüketici Fiyat Endeksi (TÜFE) çeyreklik verileri analiz edilmiştir. Analiz sonuçlarına göre istatistiksel yöntemlerden; Kutu grafiği enflasyonist dönemin yaşandığı gözlemleri, QQ grafiği, histogram ve z-score yöntemleri enflasyonist dönemdeki en yüksek değere sahip gözlemleri aykırı olarak tahmin etmiştir. Makine öğrenme yöntemlerinden, Yerel aykırı değer faktörü (Local outlier factor-LOF), Tek-sınıf destek vektör makineleri (One-class support vector machine-OCSVM) ve Bağlantıya dayalı aykırı değer faktörü (Connectivity-based outlier factor- COF) veri setindeki en düşük ve en yüksek enflasyon dönemlerini aykırı değer olarak belirlemiştir. İzolasyon ormanı (Isolation forest-IF), Açıya dayalı aykırı değer tespiti (Angle-based outlier detection-ABOD), Histograma dayalı aykırı değer skoru (Histogram-based outlier score-HBOS) ve en yakın komşu (k-nearest neighbor-KNN) gibi yöntemler ise enflasyonist dönemdeki gözlemleri aykırı değer olarak tahmin etmiştir.