MAKİNE ÖĞRENİMİ YÖNTEMLERİ İLE TÜRKİYE İSTATİSTİKİ BÖLGELERİNDE COVID-19 YAYGINLIĞININ ANALİZİ


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Mühendislik Fakültesi, Endüstri Mühendisliği, Türkiye

Tezin Onay Tarihi: 2022

Tezin Dili: Türkçe

Öğrenci: Hatice Nur CANPOLAT

Danışman: Ertan Güner

Özet:

Çin’in Wuhan eyaletinde Aralık 2019'da ortaya çıkan COVID-19 salgını, kısa zaman içinde bütün dünyaya yayılmıştır. Dünya üzerindeki COVID-19 hasta sayısının 12 Kasım 2021 tarihi itibariyle 252 milyon 44 bin 337’e ulaştığı, ölümlü vaka sayısının ise 5 milyon 82 bin 431 olduğu görülmektedir. COVID-19 salgınına benzer küresel salgın durumlarında bir ülkenin sağlık sisteminde oluşacak yükün önceden tahmin edilmesi ise hayati derecede önemlidir. Bu çalışmada ise literatürde tahminleme ile ilgili yer alan uygulamalarda etkili performans gösteren rastgele orman regresyonu (RFR), bayes sırt regresyon (BRR) ve lineer regresyon (LR) algoritmaları Türkiye’de COVID-19 salgınının yaygınlığını tahmin etmek amacıyla kullanılmıştır. Çalışmanın literatüre katkısı, Türkiye’nin 12 istatistiki bölgesi COVID-19 vaka sayısını tahmin etmek amacıyla modellerin ayrı ayrı oluşturulmuş olmasıdır. Bölge bazlı vaka sayılarının tahmin edilmesindeki esas amaç farklı iklim ve farklı demografi koşullarının salgınların genel yayılımını etkileyen ana unsurlardan olmasıdır. Ülkeler geneli tahmin modellerinde bölgesel yayılım farklılıklarının oluşturabileceği kısıtlar göz ardı edildiğinden, bölge bazlı tahminlerde daha gerçekçi ve net tahmin modelleri söz konusudur. Elde edilen sonuçlara göre İstanbul bölgesinde R2=0,98 değeri ile RFR modeli bütün bölgeler için en yüksek tahmin performansını göstermiştir. Aynı bölge için LR modeli R 2=0,69 iken BRR modeli R2=0,57 değeri ile diğer tahmin modellerinin gerisinde kalmıştır. Bu çalışmanın sonuçları göz önünde bulundurulacak olursa makine öğrenimi temelli regresyon algoritmalarının, çeşitli zaman serisi verileri veya üstel dağılımlı yüksek tahmin güçlüğü olan dalgalı veri setlerinde de etkili analizler gerçekleştirebildiği görülmektedir.

Anahtar Kelimeler : COVID-19, Türkiye, makine öğrenimi, rastgele orman regresyonu, bayes sırt regresyonu, lineer regresyon