Aralıklı tip-2 bulanık kümelerle dġlsel özetleme


Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2013

Tezin Dili: Türkçe

Öğrenci: Fatih Emre Boran

Danışman: DİYAR AKAY

Özet:

Bilgi teknolojilerinde meydana gelen gelişmeler veriye erişimi kolaylaştırmış ve farklı kaynaklardan elde edilen büyük boyutlu verinin saklanabilmesine imkan sağlamıştır. Büyük boyutlu veriye sahip olmaktan ziyade veriden insanlar tarafından kolay anlaşılacak bilginin çıkarılması daha önemli bir süreçtir. Bu nedenle bilginin doğal dil temelli cümlelerle gösterimini sağlayan dilsel özetleme işlemi son zamanlarda önemli bir veri madenciliği tekniği olarak ortaya çıkmıştır. Dilsel özetlemeyle ilgili yapılan çalışmaların çoğunda kelimeler klasik bulanık kümelerle (tip-1 bulanık kümelerle) modellenmiştir. Tip-1 bulanık kümeler kişiden kaynaklanan belirsizliği ele alabilmektedir; fakat, kişilerin farklı düşüncelerinden kaynaklanan belirsizliği ele alamamaktadır. Her iki tip belirsizliği ele alabilmek için dilsel özetleme işlemi aralıklı tip-2 bulanık kümelerle gerçekleştirilmiş ve dilsel özetlerin değerlendirilmesinde skalar kardinalite temelli doğruluk derecesi kullanılmıştır. Fakat skalar kardinalite temelli doğruluk derecesinin kullanımı bazı durumlarda tutarsız ve veri tarafından desteklenmeyen dilsel özetlerin üretilmesine neden olmaktadır. Bu tez çalışmasının ana konusu daha tutarlı ve veri tarafından desteklenen dilsel özetlerin üretilmesini sağlamaktır. Bu amacı gerçekleştirebilmek için aralıklı tip-2 bulanık kümelerle etiketlenen dilsel özetlerin değerlendirilmesinde iki yeni doğruluk derecesi önerilmiştir. Önerilen ilk doğruluk derecesi, aralıklı tip-2 bulanık kümelerin aralıklı alfa kesmeleriyle gösterimine dayanmaktadır. Bu nedenle, ilk olarak aralıklı tip-2 bulanık kümelerin aralıklı alfa kesmeleriyle gösterilebileceği ispatlanmıştır. Daha sonra aralıklı tip-2 bulanık kümelerden aralıklı kütle atama fonksiyonunu elde eden yeni bir yöntem geliştirilmiş ve geliştirilen yöntemin literatürde tanımlanan şartları sağladığı ispat edilmiştir. Son olarak doğruluk derecesinin alabileceği en büyük ve en küçük değeri bulabilmek için kısıtlı doğrusal olmayan matematiksel bir model önerilmiştir. Önerilen ikinci doğruluk derecesi aralıklı tip-2 bulanık kümenin alfa kesmesi ile elde edilen alt ve üst kesin kümelerle gösterimine dayanmaktadır. İlk olarak alt ve üst kesin kümeler bulunmuştur. Daha sonra her bir alfa kesmesi için olası değerler elde edilmiştir. Son olarak olasılık dağılımı ve olası değerlerin niceleyiciden almış olduğu en büyük ve en küçük değerler bulunarak aralıklı doğruluk derecesi hesaplanmıştır. Bu tez çalışmasında iki yeni doğruluk derecesinin yanısıra dilsel özetlerin yeterli veri tarafından kapsanıp kapsanmadığını, yararlı olup olmadığını ve aykırı bir özet olup olmadığını ölçen aralıklı kapsama derecesi, aralıklı fayda derecesi ve aralıklı aykırılık derecesi gibi yeni kalite ölçümleri önerilmiştir. Ayrıca, bu tez çalışmasında iki farklı dilsel özetin benzerliğinin ölçülmesi için yeni bir benzerlik ölçümü geliştirilmiştir. Geliştirilen benzerlik ölçümünün literatürde tanımlanan aksiyomları sağladığı ispatlanmış ve hangi alanlara uygulanabileceği tartışılmıştır. Önerilen doğruluk dereceleri ve literatürdeki mevcut doğruluk derecesi kullanılarak Avrupa Brent Spot petrol varil fiyatları zaman serisi dilsel olarak özetlenmiştir. Elde edilen sonuçlar karşılaştırıldığında önerilen doğruluk dereceleri ile elde edilen özetlerin mevcut doğruluk derecesi kullanılarak elde edilen özetlere göre daha tutarlı olduğu görülmüştür.