Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye
Tezin Onay Tarihi: 2020
Tezin Dili: Türkçe
Öğrenci: ENES CENGİZ
Danışman: CEMAL YILMAZ
Özet:Son yıllarda derin öğrenme algoritmalarının kullanımında önemli bir artış göze çarpmaktadır. Uygulamalarda derin öğrenme modellerinden konvolüsyon sinir ağı (CNN) özellikle görüntü işlemede insanlar ve araçlar gibi önemli nesneleri diğer nesnelerden ayırmak için sıklıkla kullanılmaktadır. 2012'de ImageNet Büyük Ölçekli Görsel Tanıma Yarışması'ndan (ImageNet Large Scale Visual Recognition Competition, ILSVRC) sonra, uygulamalarda CNN kullanımı oldukça yaygınlaşmaktadır. Görüntü işleme donanımlarının gelişmesiyle görüntü işleme süreci önemli ölçüde azaltılmaktadır. Bu gelişmeler sayesinde derin öğrenme üzerine yapılan çalışmaların performansı artmaktadır. Kuş bakışı farklı yüksekliklerden drone ile çekilen görüntülerden nesne tespiti oldukça zor olmaktadır. Bu çalışmada, dronlar tarafından çekilen videoda nesneleri (insan, otomobiller, bisikletler ve motosikletler) tespit etmek için bir sistem geliştirilmiştir. Sinir ağının eğitimi ve test edilmesi için, farklı yüksekliklerden kuş bakışı çekilen görüntülerden oluşan bir veri seti hazırlanmıştır. Çalışmada 2015 yılında ImageNet yarışmasında birinci olan Residual Networks (ResNet-50) ağırlıkları kullanılan RetinaNet modeli tercih edilmiştir. Sinir ağını eğitmek için, kullanıcılarına Nvidia Tesla K80 GPU desteği sunan Google'ın açık kaynak ortamı Google Colabratory kullanılmıştır. Bu ortamda, sinir ağının eğitim ve test süreçleri hızlı bir şekilde tamamlanmıştır. Eğitilmiş modelde, nesnelerin tespit işlemi için farklı eşik değerleri kullanılarak performans karşılaştırması yapılmıştır. Bu tez çalışmasının sonuçlarına göre, belirlenen nesnelerin tespitinde f1 skor değeri, 0.4 eşik değeri kullanılarak 0.906 olarak belirlenmiştir