Genetik algoritma ile dilsel özetlerin çıkarılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2015

Öğrenci: TUNAHAN ALTINTOP

Danışman: MUHAMMET ÜNAL

Özet:

Günümüzde sağlık hizmetlerinin sürekli olarak etkili ve verimli bir şekilde sunulabilmesi bununla birlikte kaynaklarında etkin kullanılabilmesi için, sağlık bilgi sistemlerindeki ham veriler üzerinde performans analizleri yapmak veya bu verilerden anlamlı bilgi çıkarımları oluşturmak gerekmektedir. Bu bağlamda kullanılan yöntemler, verimlilik ölçüm teknikleri ve veri madenciliği teknikleridir. Veri madenciliği, büyük ölçekli veriler arasından anlamlı bilgiye ulaşma veya madenleme olarak tanımlanmaktadır. Kullanılan yöntemlerden biri olan, dilsel özetleme, insan algısına doğrudan hitap eden doğal dil cümleleri ile ham veriden anlamlı bilgi çıkarımları sağlamaktadır. Günümüzde üzerinde çalışma yapılacak veri tabanlarının devasa boyutlarda veri içermesinden ve oldukça fazla nitelik barındırmasından dolayı, dilsel özetlemenin genetik algoritma gibi optimizasyon algoritmaları ile birlikte kullanılması zorunluluğu doğmuştur. Bu tez çalışmada, sağlık tesislerine ait idari ve finansal içerikteki verileri analiz etmek ve geleceğe yönelik kaynak planları oluşturmak için genetik algoritma ile dilsel özetlerin çıkarıldığı sistem geliştirilmiştir. Geliştirilen sistemin aşamaları, özniteliklerin ve dilsel niceleyicinin bulanıklaştırılması ve genetik algoritma ile dilsel özet cümlelerinin çıkarılmasıdır. Literatürde genetik algoritma ile dilsel özet cümlelerinin çıkarılması üzerine yapılan çalışma sayısı oldukça azdır. Bu çalışmalardan farklı olarak, sistem yapısı daha detaylı olarak açıklanmış, bulanıklaştırma işlemi dinamik olarak gerçekleştirilmiş, daha uygun genetik modelleme yapılmış, farklı cümle değerlendirme yöntemleri kullanılmış ve en uygun genetik algoritma parametre değerleri deneysel çalışmalar ile belirlenmiştir. Sistemden elde edilen özet cümleleri analiz edildiğinde oldukça anlamlı sonuçlar elde edildiği gözlemlenmiştir. Geliştirilen sistem dinamik yapıda olduğundan gelecekte daha farklı veri setleri ile çalışmalar yapılabilecektir.