İkili Kümeleme Algoritmalarının Görsel Ve Sayısal Açıdan Karşılaştırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Türkiye

Tezin Onay Tarihi: 2018

Tezin Dili: Türkçe

Öğrenci: Ahmet Kocatürk

Danışman: BÜLENT ALTUNKAYNAK

Özet:

Gen açıklama verilerinde benzer ifade yapılarına göre gen gruplarını belirlemek oldukça önemlidir. Bu veriler için yapılacak kümeleme analizlerinde son zamanlarda popüler olan ikili kümeleme yöntemleri kullanılmaktadır. İkili kümeleme yöntemlerinde farklı gen açıklama veri yapıları için çok sayıda algoritma önerilmiştir. Araştırmanın amacına göre elde edilecek ikili kümelerin etkinliğini ölçmek için bu algoritmaların performanslarına bakılması gerekir. Bu çalışmada en yaygın olarak kullanılan CC, Bimax, Plaid, Spectral, Quest ve Xmotif algoritmalarının performansları görsel ve sayısal olarak karşılaştırılmıştır. Bu algoritmaların görsel karşılaştırmasında ikili kümelerin ısı grafiklerine bakılmıştır. Sayısal karşılaştırılmasında ise varyans ölçüsü (VAR), ortalama karesel artık skoru (MSR), uygunluk indeksi (UI), ölçeklenen ortalama karesel artık skoru (SMSR), Chia ve Karuturi ikili küme skoru (CKSB), ortalama korelasyon ölçüsü (ACV), alt matris korelasyon ölçüsü (SCS), ortalama Spearman korelasyon değeri (ASR), Spearman ikili küme ölçüsü (SBM) ve sanal hata (VE) ikili küme değerlendirme ölçüleri hesaplanmıştır. Değerlendirme ölçüleri hesaplaması R fonksiyonları ile oluşturulmuş ve analizler bu kodlara uygulanarak gerçekleşmiştir. Farklı veri yapılarında karşılaştırma yapmak için yapay ve gerçek veriler kullanılmıştır. Yapay veri seti uygulamasında dört farklı senaryo ile ikili kümeler oluşturulmuştur. Bunlar ikili kümeler arasında örtüşme ve aykırı değerlerin olup olmadığı durumlardır. Gerçek veri seti uygulamasında ise maya verisi, lenf hücrelerinin gen ifadesini içeren insan verisi ve protein-protein etkileşim skorlarını içeren fare verisi kullanılmıştır. Yapılan analizler sonucunda hangi algoritmanın hangi veri setinde daha anlamlı ikili kümeler elde ettiği belirlenmiştir.