Biyoinformatikte çok boyutlu verilerin boyut indirgenerek sınıflandırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2015

Öğrenci: HATİCE ZEHRA DEMİRCİOĞLU

Danışman: HASAN ŞAKİR BİLGE

Özet:

Günümüzde biyoinformatik alanda devasa boyuttaki verileri veri madenciliği yöntemleri kullanarak işlemek büyük önem kazanmaktadır. Mikrodizi teknolojisi ile elde edilen gen ifade verileri üzerinde çeşitli boyut indirgeme ve öznitelik seçme yöntemleri kullanılarak hastalığa neden olan genlerin tespit edilmesi biyoinformatik alanda önemli bir yel almaktadır. Bu çalışmada, mikrodizi teknolojisinden elde edilen yumurtalık kanseri gen ifade veri kümesi üzerinde öznitelik seçme yöntemlerinden ve boyut indirgeme yöntemlerinden bazıları kullanılarak veri kümesi küçültülerek çeşitli sınıflandırma yöntemleri ile başarıları ölçülerek yumurtalık kanseri olan hastalarda hangi genlerin daha önemli olduğuna karar verilmeye çalışılmıştır. Öznitelik seçme yöntemlerinden Fisher Korelasyon Skorlama ve Weltch-T İstatistiği yöntemleri kullanılarak veri setindeki gen öznitelik sayısı bine indirgenerek, ilk 100 gen içinde sınıflandırma başarıları bulunmuştur. Çeşitli sınıflandırıcı başarımları arasında destek vektör makineleri(lineer çekirdek fonksiyonu) sınıflandırıcısı ile %100 başarı elde edilmiştir.