Büyük yüz veritabanlarında hızlı arama sistemi


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2016

Öğrenci: AHMET EDİP ÇAPANOĞLU

Danışman: HASAN ŞAKİR BİLGE

Özet:

Günümüzde görüntü işleme ve örüntü tanıma geniş bir alana yayılarak yüz tanıma algoritmalarının başarı oranları yükselmektedir. Diğer yandan bu algoritmaların kullanıldığı veritabanı boyutları da sürekli artış göstermektedir. Bu artış ile birlikte büyük veri tabanlarında arama işlemleri de çok önemli bir hale gelmiştir. Büyük yüz veri tabanlarında doğru sonuçların hızlı elde edilmesi üzerine farklı yöntemlerle çeşitli çalışmalar yapılmaktadır. Bu çalışmada büyük veri tabanlarında daha hızlı arama yapabilmek için geometrik özelliklerin çıkarılması yaklaşımı kullanılmıştır. Tezde yüz tanımadan önceki adım olan görüntüdeki yüzü bulma işleminden de bahsedilmiştir. Bulunan görüntü çerçevesinde yüz hizalanmıştır ve her bir yüz için 68 adet özel nokta tespit edilmiştir. Ayrıca geometrik yüz tanıma sistemi için kullanılacak yüz noktaları ve bunların arasındaki mesafeler detaylandırılmıştır. Daha anlamlı sonuçlar elde etmek amacı ile her bir yüz görüntüsü için standart 20 farklı nokta seçilmiştir. Bu noktalardan belirli ölçümler sonucu elde edilen 15 farklı öznitelik oluşturulmuştur. Sistemin eğitiminde bu noktalardan oluşturulan öznitelik vektörü veritabanına sırası ile kaydedilmiştir. Arama işlemi yapılırken ise aynı şekilde aranacak yüz görüntüsünün geometrik mesafe özellikleri çıkarılarak veritabanından karşılaştırma yapılmıştır. Çalışmamızda 32 farklı veritabanı birleştirilerek 131.483 görüntü içeren büyük bir veritabanı oluşturulmuştur. Birleştirilmiş bu veritabanında bir kısım görüntüler eğitim ve diğerleri test olacak şekilde ayrılarak 10-kat çapraz doğrulama ile testler yapılmıştır. Benzer görüntünün ilk sırada çıkma doğruluk oranları veri tabanları yapısına göre %55,2 ile %70,5 arasında değişim göstermekte, benzer şekilde doğru sonucun ilk 5 sıradan birinde çıkma oranları ise %71,3 ile %86,1 arasında olacak şekilde hesaplanmıştır. Arama yapılırken uzaklık hesaplama ve sayısal veriler üzerinden indeksleme yapıldığından daha hızlı sonuçlar elde edilmiştir. Sistemin arama performansı 0,023 sn. ile 0,809 sn. arasında farklılık göstermektedir.