Eğitim Kitabevi, Ankara, 2024
İş kazası bilgileri alınırken seçeneklerden uygun olan birinin bildirim yapan kişi tarafından belirlendiği alanların yanı sıra bildirimi yapan kullanıcıya kaza hakkında ayrıntılı bilgi verebilmesi için açıklama bölümü bulunmaktadır. Bu açıklama kısmında bildirimi yapan kişinin kendi kelimeleri ile kazanın yeri, zamanı, nedeni, oluş şekli vb. ayrıntılı bilgi verilmesi beklenmektedir. Bazı kullanıcılar iş kazasını tek kelime ile ifade ederken bazıları ise daha uzun ve ayrıntılı bir şekilde kazayı açıklamaktadır. Bildirimi giren kişiler, kendi doğal dil yetkinlikleri ile sisteme iş kazası girişi yapmaktadırlar. Doğal dile dayalı açıklama metinlerindeki ham veriler kaza nedeni, hata kaynağı ve yaralanma türü gibi tüm kaza süreci hakkında bilgiler içerdiğinden özellikle kıymetlidir. İstatistiklerde yer bulmayan bu kıymetli verilerin işlenerek kaza türleri ve nedenleri anlaşılabilir hale getirmek, kazalara karşı önlem alabilmek ve politika geliştirmek adına önem arz etmektedir. Çalışmada, 2015-2020 yılları arasında oluşturulan, SGK iş kazası kayıtlarının açıklama metinlerinde yer alan gizlenmiş bilgileri belirleyip kaza süreçlerine ilişkin ortak faktörlerin ortaya çıkarılması, kaza türleri ile kaza süreç örüntülerinin belirlenmesi amaçlanmaktadır. Çalışmada bir Metin Madenciliği yöntemi olan konu modelleme kullanılmıştır. Konu modelleme için Gizli Dirichlet Ayrımı (GDA) algoritması kullanılarak sık sık birlikte ortaya çıkan ve genellikle ortak bir temayı paylaşan kelimelerden oluşan kelime kümeleri belirlenmiştir. Bu kelime kümelerinin ait oldukları konu grupları belirlenerek gerçek veriler üzerinden, gizli kalmış ya da önemsiz atfedilen konuları da göz önünde bulunduran yeni bir iş kazası sınıflandırması geliştirilmiştir.