Optimizasyon Temelli Öznitelik Seçme Yöntemleri İle Desteklenen Topluluk Öğrenme Yaklaşımına Dayalı Yazar Tanıma


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2021

Tezin Dili: Türkçe

Öğrenci: Merve GÜLLÜ

Danışman: HÜSEYİN POLAT

Özet:

İnternet ve özellikle sosyal medya aracılığıyla veri arama, kopyalama ve yayma fırsatlarının artması doğru bilgiye ulaşımı azaltmıştır. Veriden doğru bilgiye ulaşma konusunda metin madenciliği alanında yapılan çalışmalardan biri metin yazarı tahminidir. Bir metin, onu yazan kişinin karakteristik özelliklerini taşır ve bu özellikler metnin yazarını tanımlamak için kullanılabilir. Bu çalışmada 54 adet yazar, değişken sayıda ve değişken uzunlukta toplam 46.837 adet köşe yazısı ile bir derlem oluşturulmuştur. Yazarların karakteristik özelliklerini çıkarmak için iki farklı analiz ve iki analizin birleştirilmesi ile oluşturulmuş karma analiz hazırlanmıştır. Analiz sonuçlarının verimliliğini artırmaya yönelik Rastgele Orman Algoritması ile Genetik Algoritma ve Tavuk Sürü Optimizasyon Algoritması yaklaşımlarına dayalı toplamda iki farklı öznitelik seçim yöntemi sunuldu. Yapılan analizler sonucunda en verimli yazar tahmini çözüm önerisi, Topluluk Öğrenimi Algoritmaları ile desteklendi. En iyi performans, Karma Analiz ve sonrasında Genetik Optimizasyon algoritması ile gerçekleştirilen işlemler sonucu oluşturulan on yazarlı veri kümesi üzerinde Torbalama Algoritmasında sınıflandırıcı metot olarak Karar Ağacı kullanımında % 95,74 olarak elde edilmiştir