Tezin Türü: Doktora
Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Eğitim Bilimleri Enstitüsü, Eğitim Bilimleri Enstitüsü, Türkiye
Tezin Onay Tarihi: 2024
Tezin Dili: Türkçe
Öğrenci: SELMA TOSUN
Danışman: Dilara Bakan Kalaycıoğlu
Özet:
Bu çalışmanın amacı,
açık ve uzaktan eğitimde okuyan öğrencilerin sistemler üzerinden elde
edilebilecek verileri ile okul terki ve akademik başarı durumlarını tahmin
etmek ve sınıflandırma performansı yüksek veri madenciliği modellerini
belirleyerek bunlara göre akademik başarı ve okul terkinde etkili olan
değişkenleri ortaya çıkartmaktır. Araştırmada, yükseköğretimdeki açık ve
uzaktan eğitim öğrencilerinin demografik ve kişisel verileri ile ağırlıklı
genel not ortalaması puanı değişken olarak alınarak okul terki riski taşıyan
öğrencileri erken tespit edebilmek için veri madenciliği algoritmaları ile bir
model geliştirilmiştir. Çalışmada veri madenciliği yaklaşımının eğitim alanında
kullanılması ile bu algoritmalara dayalı olarak elde edilen sonuçların
güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmiştir. Bu
araştırma amacı bakımından nicel araştırma yöntemlerinden olan ilişkisel
araştırma modelindedir. Araştırmanın türü, çalışma grubu, veri toplama araçları
ve verilerin analizine yönelik işlemler, veri madenciliği için Alanlararası Standart
Prosedürler (CRISP-DM) sürecinde yer alan aşamalar ile ilişkilendirilerek ele
alınmıştır. Araştırma, İstanbul
Üniversitesi Açık Ve Uzaktan Eğitim Fakültesi’nde (İÜ AUZEF) 2021-2022 bahar
dönemine kadar en az bir defa bir programa kayıt olan tüm öğrencilerin İstanbul
Üniversitesi öğrenci bilgi sistemi veri tabanından elde edilen verileri ile
yürütülmüştür. Analiz sürecinde okul terki ve akademik başarıya göre
öğrencilerin Sınıflandırılmasında Rastgele Ağaçlar, C&RT, C5.0, CHAID,
QUEST gibi Karar Ağaçları İle Naive Bayes (NB), Lojistik Regresyon (LR), Yapay
Sinir Ağları (YSA) ve Destek Vektör Makinesi (DVM) gibi çeşitli VM
algoritmaları kullanılmış ve bunların performansları doğruluk, duyarlılık,
hassasiyet, kesinlik, negatif öngörü değeri, F1 puanı, MCC, AUC kriterlerine
göre değerlendirilmiştir. Araştırmanın sonucunda okul terkine göre öğrencilerin
sınıflandırılması için oluşturulan modellerin genel doğru sınıflandırma
oranlarının 0,754 ile 0,790 arasında değiştiği görülmüştür. Tüm veri setinde
genel sınıflandırma doğruluğu en yüksek model C5.0’dır. Ayrıca C5.0 modeli
diğerlerine göre en yüksek duyarlılık, F1 puanı, kesinlik, negatif öngörü
değeri ve MCC değerine de sahip olduğundan okul terkinin tahmininde modelin
yeterli geçerliliğe sahip olduğu sonucuna varılmıştır. En yüksek hassasiyet
C&RT modeli; en yüksek AUC değeri ise yapay sinir ağları modeli ile elde
edildiği için bu üç modelin okul terkinin belirlenmesinde kullanılabileceği
sonucuna ulaşılmış ve terkte etkili olan faktörler bunlar aracılığı ile ele
alınmıştır. Modellerin okul terki için sınıflandırma yaparken ilk iki sırada
ağırlıklı genel not ortalamasını ve öğrenci kayıt yılı faktörünü kullandığı;
daha sonra ise modellere göre önem sırası farklılaşsa da program türü, yaş,
kayıt/geliş şekli, öğrenim tipi, program düzeyi, ikamet ili ve cinsiyet
değişkenlerinin sınıflandırmada etkili olduğu sonucuna ulaşılmıştır. Araştırma
sonucunun okul terkinin azaltılmasına yönelik geliştirilecek stratejilere katkı
sunması beklenmektedir.