Mamdani ve Sugeno Tip Bulanık Çıkarım Sistemleri ile Sosyal Medya Haber Popülerliğinin Tahmini


Creative Commons License

Atacak İ., Şencan Ö. A.

Uluslararası Mühendislik Araştırma ve Geliştirme Dergisi, cilt.14, sa.3, ss.303-320, 2022 (Hakemli Dergi)

Özet

Haber popülerliği, internet ya da sosyal ağ sitelerinde yayınlanmış haberlerin ilgi düzeyinin ölçüsünün bir göstergesidir. Bu göstergenin değerinin bilinmesi, haber sağlayıcılarını rekabetçi ve kullanıcılar için okunabilirliği yüksek haberler yapmaya zorlar. Bu durum, hem haber servislerinin sürekliliğine hem de haber kalitesinin artırılmasına önemli katkılar sağlar. Bu yüzden, haber popülerliğini otomatik olarak tespit eden sistemlerin olması günümüzde bir ihtiyaç haline gelmiştir. Bu çalışmada, Kaliforniya Üniversitesi (KU)-Irvine Makine Öğrenmesi Deposu veri tabanından indirilen veriler bileştirilerek oluşturulmuş dengesiz veri seti ve bu veri setinden Sentetik Azınlık Örnekleme Tekniği (Synthetic Minority Oversampling Technique (SMOTE)) ile üretilen dengeli veri setine Mamdani ve Sugeno tip bulanık çıkarım sistemi temelli modeller uygulanarak haber popülerliği tahmini yapılmıştır. Haber popülerliği tahmininde çıkarım yöntemleri ve durulaştırma yöntemlerinin farklı biçimde yapılandırılmasından oluşan 6’ sı mamdani tip bulanık çıkarım sistemini ve 2’ si sugeno tip bulanık çıkarım sistemini içeren toplam 8 bulanık mantık temellli tahmin modeli kullanılmıştır. Karışıklık matrisi metrikleri ve R2 eğrileri ile performansları değerlendirilen tahmin modellerine ait deneysel sonuçlar; dengesiz ve dengeli veri setlerinin her ikisinde de tüm metrikler açısından en iyi performansı mak-min çıkarım yöntemi ve ağırlık merkezi durulaştırma yöntemini kullanan Mamdani tip bulanık çıkarım sisteminin sağladığını göstermiştir. Ayrıca yaptığımız çalışmada kullanılan modelleri literatürdeki çalışmalar ile karşılaştırdığımızda, ağırlıklı ortalama yöntemini kullanan Sugeno tip bulanık çıkarım sistemi dışındaki bulanık mantık temelli modellerin literatürdeki modellerin en iyileri kadar rekabetçi bir performans sergileyebildiği görülmüştür.

News popularity is an indicator that measures the relevance of news published on the internet or social networking sites. News providers have to deliver competitive and user-readable news to ensure this indicator changes in their favour. This contributes to both the continuity of news services and the improvement of news quality. Therefore, it has become a necessity nowadays to have systems that automatically detect news popularity. In this study, news popularity prediction is made by applying Mamdani and Sugeno type fuzzy inference-based models to the unbalanced data set created by combining data downloaded from the University of California (UC)-Irvine Machine Learning Repository database and the balanced data set produced from this dataset by Synthetic Minority Oversampling Technique (SMOTE). For news popularity prediction, 8 different fuzzy logic-based configurations were created using different inference and defuzzification methods. Of these configurations, 6 are Mamdani-type fuzzy inference system and 2 are Sugeno-type fuzzy inference system. Experimental results of prediction models, whose performances are evaluated with confusion matrix metrics and R2 curves, showed that the best performance in terms of all metrics in both unbalanced and balanced datasets was provided by the Mamdani type fuzzy inference system using the max-min inference method and the centroid defuzzification method. In addition, when the experimental results of the models developed here were compared with those of similar studies in the literature, it was proven that all fuzzy logic-based models, except for the Sugeno type fuzzy inference system, which uses the wtaver method, performed as competitive as the best models in similar studies.