Bulanık dilsel özetlemenin olasılıklı belirsizliği dikkate alan bir genişlemesi

Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2015

Öğrenci: SENA AYDOĞAN

Danışman: DİYAR AKAY

Özet:

Dilsel özetleme tanımlayıcı amaçlı veri madenciliği tekniklerinden birisidir. Büyük hacimdeki sayısal verinin doğal dil temelli insanların kolayca anlayabileceği bir yapıda ifade edilmesini sağlar. Gerçek dünya bilgisi çeşitli belirsizlikler içerir ve olasılık teorisi, olabilirlik teorisi veya kanıt teorisi gibi sıklıkla tercih edilen yöntemlerle modellenir. Mühendislik, ulaşım, karar verme gibi alanlarda birden fazla belirsizlik çeşidi bir arada bulunur ve bu farklı belirsizliklerin birlikte modellenmesi bilgiyi daha doğru yansıtacağından önemlidir. Z-sayısı hem olasılığı hem olabilirliği dikkate alan yeni bir kavramdır. Z-sayısı iki bileşenden oluşur, (A,B). A değişkenin değerini bir bulanık küme ile ifade ederken, B A'nın kesinliğini yine bir bulanık küme ile gösterir. Dilsel özetleme yönteminde en önemli adım elde edilen özetin doğruluk derecesinin hesaplanmasıdır. Z-sayısında B'nin A'yı sağlama derecesi dilsel özetlemedeki doğruluk derecesi hesaplamasıyla çok benzerdir. Literatürde dilsel özetlerin değerlendirilmesi için skalar ve bulanık kardinalite temelli yöntemler geliştirilmiştir. Ancak farklı belirsizliklerin bir arada olduğu verilerin özetlenmesinde kullanılacak bir yöntem mevcut değildir. Bu nedenle dilsel özetleme ve Z-sayısı benzerliğinden yola çıkılarak dilsel özetlerin değerlendirilmesinde olasılık ve olabilirlik teorisini bir arada kullanan Z-sayısı temelli yeni bir yaklaşım önerilmiştir. Önerilen yaklaşımda tip-II niceleyici cümleler için farklı değişkenlere ait ortak olasılık dağılımını elde etmede kopulalardan faydalanılmıştır. Veritabanındaki değişkenler arasındaki korelasyon da, örneğin, bağımsız, pozitif ilişkili veya negatif ilişkili, hesaplamaya kopula kullanımı ile dâhil edilmiştir. Önerilen yöntem örnek bir verisetinde test edilmiş ve mevcut dilsel özetleri değerlendirme yöntemleri ile karşılaştırılmıştır.