Uluslararası Mühendislik Araştırma ve Geliştirme Dergisi, cilt.14, sa.3, ss.303-320, 2022 (Hakemli Dergi)
Haber popülerliği, internet ya da sosyal ağ sitelerinde yayınlanmış haberlerin ilgi düzeyinin ölçüsünün bir göstergesidir. Bu göstergenin değerinin bilinmesi, haber sağlayıcılarını rekabetçi ve kullanıcılar için okunabilirliği yüksek haberler yapmaya zorlar. Bu durum, hem haber servislerinin sürekliliğine hem de haber kalitesinin artırılmasına önemli katkılar sağlar. Bu yüzden, haber popülerliğini otomatik olarak tespit eden sistemlerin olması günümüzde bir ihtiyaç haline gelmiştir. Bu çalışmada, Kaliforniya Üniversitesi (KU)-Irvine Makine Öğrenmesi Deposu veri tabanından indirilen veriler bileştirilerek oluşturulmuş dengesiz veri seti ve bu veri setinden Sentetik Azınlık Örnekleme Tekniği (Synthetic Minority Oversampling Technique (SMOTE)) ile üretilen dengeli veri setine Mamdani ve Sugeno tip bulanık çıkarım sistemi temelli modeller uygulanarak haber popülerliği tahmini yapılmıştır. Haber popülerliği tahmininde çıkarım yöntemleri ve durulaştırma yöntemlerinin farklı biçimde yapılandırılmasından oluşan 6’ sı mamdani tip bulanık çıkarım sistemini ve 2’ si sugeno tip bulanık çıkarım sistemini içeren toplam 8 bulanık mantık temellli tahmin modeli kullanılmıştır. Karışıklık matrisi metrikleri ve R2 eğrileri ile performansları değerlendirilen tahmin modellerine ait deneysel sonuçlar; dengesiz ve dengeli veri setlerinin her ikisinde de tüm metrikler açısından en iyi performansı mak-min çıkarım yöntemi ve ağırlık merkezi durulaştırma yöntemini kullanan Mamdani tip bulanık çıkarım sisteminin sağladığını göstermiştir. Ayrıca yaptığımız çalışmada kullanılan modelleri literatürdeki çalışmalar ile karşılaştırdığımızda, ağırlıklı ortalama yöntemini kullanan Sugeno tip bulanık çıkarım sistemi dışındaki bulanık mantık temelli modellerin literatürdeki modellerin en iyileri kadar rekabetçi bir performans sergileyebildiği görülmüştür.
News popularity is an indicator that measures the relevance of news published on the internet or social networking sites. News
providers have to deliver competitive and user-readable news to ensure this indicator changes in their favour. This contributes to
both the continuity of news services and the improvement of news quality. Therefore, it has become a necessity nowadays to have
systems that automatically detect news popularity. In this study, news popularity prediction is made by applying Mamdani and
Sugeno type fuzzy inference-based models to the unbalanced data set created by combining data downloaded from the University
of California (UC)-Irvine Machine Learning Repository database and the balanced data set produced from this dataset by Synthetic
Minority Oversampling Technique (SMOTE). For news popularity prediction, 8 different fuzzy logic-based configurations were
created using different inference and defuzzification methods. Of these configurations, 6 are Mamdani-type fuzzy inference system
and 2 are Sugeno-type fuzzy inference system. Experimental results of prediction models, whose performances are evaluated with
confusion matrix metrics and R2
curves, showed that the best performance in terms of all metrics in both unbalanced and balanced
datasets was provided by the Mamdani type fuzzy inference system using the max-min inference method and the centroid
defuzzification method. In addition, when the experimental results of the models developed here were compared with those of similar
studies in the literature, it was proven that all fuzzy logic-based models, except for the Sugeno type fuzzy inference system, which
uses the wtaver method, performed as competitive as the best models in similar studies.