DERİN ÖĞRENME TABANLI SESLİ KOMUT SİSTEMİ


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, ELEKTRİK-ELEKTRONİK MÜHENDİSLİĞİ ANA BİLİM DALI, Türkiye

Tezin Onay Tarihi: 2021

Tezin Dili: Türkçe

Öğrenci: Ayşe Nur ÇAYIR

Danışman: Tuğba Selcen Navruz

Özet:

Günümüzde yapay zeka uygulamalarında kullanılmak üzere ses tanıma ve sınıflandırmaya dayalı çalışmalara önem verilmektedir. Sesli komutları tanıyan bir sistem tasarlanırken derin öğrenmeden yararlanmak başarılı sonuçlar elde etmeyi sağlamaktadır. Bu tez çalışmasında derin öğrenme mimarilerinden olan evrişimli sinir ağı kullanılarak 12 adet İngilizce sesli komutun tanınmasını sağlayan bir sistem tasarlanmıştır. Tasarlanan sistem test doğruluğu açısından %94,64 başarı sağlamıştır. Ayrıca model eğitilirken daha önce hiç karşılaşmadığı, anadili İngilizce olmayan kişilerden alınan seslerden oluşan bir veri seti oluşturulup modelin gerçek hayattaki başarısı araştırıldığında %63,29 doğruluk oranı elde edilmiştir. Türkçe için sesli verilerin kısıtlı olduğu görülmüş ve bu doğrultuda kısıtlı veriye sahipken veri artırma teknikleri kullanılarak derin öğrenme modelinin başarısının artırılıp artırılamayacağı incelenmiştir. 12 adet sesli Türkçe komut içeren çok küçük bir veri seti oluşturulduktan sonra ses verileri manipüle edilerek veri seti büyütülmüştür. Veri artırma işlemi yapılmadan önce ortalama test doğruluğu %53,947 iken veri artırma sonrasında %85,756’ya ve ortalama gerçek hayat doğruluğu %58,074 iken veri artırmadan sonra %64,761’e çıkmıştır. Deneysel sonuçlar kısıtlı sayıda veriye sahipken dahi veri artırma sayesinde doğruluk oranlarının artırılabileceğini göstermiştir. Ayrıca veri artırmaların etkisi sınıf bazlı olarak incelenmiştir. İnceleme sonucunda veri artırma tekniklerinin sınıflara özgü olarak uygulanmasının başarıyı daha da artıracağı ve bu yönde ilerleyen çalışmalara katkı sağlayacağı düşünülmektedir.

Anahtar Kelimeler

Derin öğrenme, evrişimli sinir ağı, sesli komut, veri artırma