Sarf malzeme kullanımından veri madenciliği birliktelik kurallarının elde edilmesi, kuralların analizi ve sınıflandırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2020

Tezin Dili: Türkçe

Öğrenci: HASAN TONTUŞ

Danışman: ERTAN GÜNER

Özet:

Her geçen gün kabiliyetleri artan bilgisayar sistemleri sayesinde büyük miktardaki verilerin saklanıp işlenebilmesine rağmen, bunlardan elde edilen bilgi miktarının yeterli düzeyde olmadığı veya amaca yönelik kullanışlı bilgiye odaklanılamadığı bilinmektedir. Kurumlar veri toplama, saklama ve analiz işlemleri için yatırımlarına devam ederlerken, verilerin hacimlerinin çok büyük olması ve yapılarının da etkin bir veri analizi yapılmasına uygun olmaması nedeniyle, uygulamalarda bu verilerin bir kısmı kullanılabilmektedir. Sanayi üretimi sektöründe de üretimin bütün detaylarının saklanabildiği görülmektedir. Bu detaylardan bir tanesi de, iş emirlerinde kullanılan sarf malzemelerdir. Sarf malzeme kullanımı neredeyse tüm üretim çeşitleri için ortak payda olduğundan, bu alana yönelik bir veri analizine ihtiyaç duyulması kaçınılmazdır. İşlenmemiş verilerden işe yarayacak bilgi ya da örüntü elde etme sürecine veri madenciliği denir. Veri madenciliği çeşidi olan ve veriler içinde birlikte hareket eden öğelerin keşfedilmesini sağlayan birliktelik kurallarının tespiti için geliştirilen algoritmalar arasında en sık kullanılan model Apriori algoritmasıdır. Bu çalışmada Apriori algoritması seçilerek, bir kamu kurumunun yürüttüğü bakım-onarım faaliyetlerinde ihtiyaç duyulan sarf malzemelere yönelik bir uygulama gerçekleştirilmiştir. Son beş yıl içinde meydana gelen arızalar için kullanılan malzemelerin verileri incelenerek yapılan çalışma sonucunda elde edilen bilgilerin kullanılmasıyla, etkin ve hızlı bir planlama süreci, uygun depo düzeni, malzeme tedarik maliyetinde ve standart birim adam saatte azalma, iş yükü ve iş gücü konularında iyileştirmeler sağlanacağı değerlendirilmiştir. Ayrıca, veri setinin birbiriyle ilişkili gruplar halinde ele alınmasının önemi anlatılmıştır. Bu bağlamda bütün veri setinden elde edilen sonuçlarla, alt grup veri setlerinden elde edilen sonuçlar birbiriyle kıyaslanmıştır. Çalışmada büyük boyutlu veri seti kullanıldığından, elde edilen çok sayıdaki birliktelik kurallarına yönelik ikinci bir analiz yapılarak, kuralların amaca yönelik sınıflandırılması yapılmıştır. Çalışmada, genellikle analizcinin sezgisel olarak seçtiği minimum destek değerinin tespiti için bir formül geliştirilerek algoritmada bu formül aracılığıyla elde edilen değerler kullanılmıştır. Ayrıca, veri setinin sunduğu verilerle, ortaya çıkan kural sayısı arasındaki ilişki araştırılmıştır.