Etkin sınıflandırma için genetik algoritma tabanlı öznitelik alt küme seçimi


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2014

Öğrenci: SHİMA AFZALİ VAHED MOGHADDAM

Danışman: OKTAY YILDIZ

Özet:

Sınıflandırma, Makine Öğrenmesi ve Veri Madenciliği alanında sıklıkla kullanılan önemli yöntemlerden biridir. Öznitelik seçme teknikleri ise sınıflandırma başarısını ve performansını arttırmak için son zamanlarda sıklıkla çalışılan bir alandır. Öznitelik seçimi, metin madenciliği, biyoinformatik ve görüntü analizi gibi pek çok alanda yaygın bir şekilde uygulanmaktadır. Öznitelik seçme teknikleri veri kümesi içinden, sınıflandırma başarısını etkileyen ilgisiz niteliklerin atılması ya da önemli niteliklerin seçilmesi şeklinde olabilir. Böylece sınıflandırıcıların başarısı arttırılabilir. Bu çalışmada, genetik algoritma tabanlı hibrit etkin bir öznitelik seçme metodu önerilmektedir. Bu metot, literatürde sınıflandırma amaçlı sıklıkla kullanılan dört veri kümesi üzerinde denemiştir. Önerilen metot iki aşamadan oluşmaktadır. İlk aşamada, öznitelik havuzu oluşturmak için öznitelik sıralama metotları kullanılmıştır. İkinci aşamada, yüksek sınıflandırma performansı ile en uygun öznitelik alt kümesini seçmek için genetik algoritma kullanılmıştır. Bu çalışmada genetik algoritma ve dört ayrı sınıflandırma algoritması kullanılmıştır. Önerilen metot UCI'dan elde edilen Meme kanseri wisconsin teşhis (WDBC), Tek proton emisyon bilgisayarlı tomografi (SPECT) Heart, Statlog heart ve Meme kanseri wisconsin prognostik (WPBC) veri kümelerinde denenmiş, sırayla 100%, 91,25%, 96,29%, ve 94,8276%sınıflandırma başarısı ile etkin bir öznitelik seçme gerçekleştirilebilmiştir