Türkçe metinlerde denetimli ve sözlük tabanlı duygu analizi yaklaşımlarının karşılaştırılması

BURAK İBRAHİM SEVİNDİ

Türkçe metinlerde denetimli ve sözlük tabanlı duygu analizi yaklaşımlarının karşılaştırılması

Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2013

Öğrenci: BURAK İBRAHİM SEVİNDİ

Danışman: HACER KARACAN

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

World Wide Web (WWW) daha etkileşimli bir hal aldıkça, görüşlerini paylaşan kullanıcıların sayısı artmıştır. Kullanıcılar; ürünler, hizmetler, markalar, şirketler, haberler, vb. hakkında görüşlerini paylaşmaktadırlar. Bu paylaşım için, kişisel bloglar, Facebook ve Twitter gibi sosyal ağlar, çevrimiçi gazeteler ve e-ticaret siteleri gibi birçok araç ve teknolojileri kullanmaktadırlar. Bu durum da beraberinde bir ?görüş patlaması? getirmiştir. Artık, örneğin bir ürün hakkında Web üzerinden paylaşılan bütün yorumları okumak, hem ürün sahibi şirket hem de ürünü alacak kullanıcı açısından imkânsız hale gelmiştir. Duygu Analizi bu tip problemler üzerine ortaya çıkmış olan bir çalışma alanıdır. Duygu analizi, bir bütüncedeki görüş bildiren metin kısımlarını belirleme, bu metin kısımlarını ifade ettikleri görüşe göre sınıflandırma ve görüşleri kolayca anlaşılabilir özetler halinde kullanıcıya sunma işlerini kapsar. Bu çalışmada, Duygu Analizi alanında yapılan güncel bilimsel çalışmalarda sıkça kullanılan iki yöntem karşılaştırılmıştır. Bu yöntemler, makine öğrenmesi yaklaşımlarıyla yapılan duygu analizi ve sözlük tabanlı yaklaşımlarla yapılan duygu analizi olarak sıralanabilir. Makine öğrenmesi yaklaşımları, etiketli eğitim verisi üzerinden öğrenmeyi gerçekleştirdiği için, denetimli yaklaşımlardır. Öte yandan, sözlük tabanlı yaklaşmlar, çekirdek bir terim kümesinden başlayıp, WordNet gibi anlamsal bir veritabanı yardımıyla bu sözlüğü bir duygu sözlüğüne dönüştüren ve bu duygu sözlüğünü de duygu analizi işlemlerinde bir kaynak olarak kullanan yarı denetimli yaklaşımalrdır. Bu çalışmada, belirtilen yöntemler Türkçe bir veri setine uygulanıp, elde edilen sonuçlar yorumlanmıştır.