Büyük hacimli görüntü veri tabanlarında hızlı görüntü arama


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2019

Tezin Dili: Türkçe

Öğrenci: OSMAN DURMAZ

Danışman: HASAN ŞAKİR BİLGE

Özet:

Bu tez çalışmasında, büyük hacimli görüntü veri tabanları üzerinde hızlı ve doğru bir şekilde görüntü arama yapılabilmesi için geliştirilen RDH (Randomized Distributed Hashing) yöntemi sunulmuştur. Büyük görüntü veri tabanlarında sorgulanan görüntülere yakın örneklerin bulunabilmesi için genellikle ANN (Approximate Nearest Neighbor) yöntemleri kullanılmaktadır. Bu yöntemlerde aranan örneklere benzer en yakın gerçek örneklerin bulunması yerine yakın olması muhtemel örnekler bulunmaktadır. Çoğu zaman özetleme yöntemleriyle gerçeklenen bu yöntemlerin kullanılmasıyla arama zamanı ciddi oranda azaltıbilmektedir. ANN arama yöntemleri genellikle merkezi olarak uygulanmaktadır. Ancak gerçek dünya uygulamalarında veriler genellikle dağıtık bir şekilde saklanmaktadır. Bu durum ANN arama yöntemlerinin dağıtık bir şekilde uygulanabilmesini gerektirmektedir. Bu amaçla önerdiğimiz yaklaşımda LSH (Locality Sensitive Hashing) dağıtık bir şekilde uygulanmıştır. Veri bir küme içindeki farklı düğümlere dağıtılmış sonrasında her bir düğümde aynı özet fonksiyon kümesi kullanılarak veri özetlenmiştir. Sorgu aşamasında sorgu örneği her bir düğümde yerel olarak aranmaktadır. Paralel sorgulardan faydalanıldığında sorgu süresi önemli oranda düşmüştür. Deneysel çalışmalarda 10 düğüm kullanıldığında sorgu hızı yaklaşık olarak 10 kat artırılmıştır. Sistemin başarısını değerlendirmek için kullanılan MAP (Mean Average Precision) değeri literatürdeki çalışmalarla kıyaslanabilecek ölçüde yüksek çıkmıştır. Bu çalışmada aynı zamanda düğümlerde aynı özet fonksiyonların kullanılması yerine farklı özet fonksiyonların ve seçilmiş özet fonksiyonların kullanımıyla LSH yönteminin dağıtık kullanımı detaylı bir şekilde irdelenmiştir. Seçilmiş özet fonksiyonları indeksleme yapılmadan önce veriyi bölme özelliğine göre oluşturulmuştur. LSH yöntemi veri bağımsız bir yöntem olduğundan düğümlerde aynı özet fonksiyonu kullanıldığında alınan sonuçlara benzer sonuçlar elde edilmiştir. Alınan sonuçlar son zamanlarda yayınlanan ve dağıtık özetleme konusunda farklı yöntemlere ait sonuçlar içeren bir çalışma ile karşılaştırılmıştır. Önerilen yöntem dağıtık olarak büyük boyutlu veri kümelerinde görüntü arama için umut vermektedir.