Mikrofon dizileri ile telekonferans sistemlerinin iyileştirilmesi


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2010

Öğrenci: ESMA SULTAN SEZEN

Danışman: HASAN ŞAKİR BİLGE

Özet:

Mikrofon sistemlerinin kullanıldığı ses algıma, ses kayıt, ses tanıma gibi uygulamalarda yaşanan en büyük problemlerden biri ortam koşulları nedeni ile ses sinyalindeki bozulmalardır. Günümüzde ses kaynağından alınan ses sinyalinin daha güçlü olarak alınabilmesi için birden fazla mikrofondan oluşan mikrofon dizileri kullanılmaktadır. Mikrofon dizilerinin normal mikrofonlara göre iki temel üstünlüğü mevcuttur; kaynağa yakın olma zorunluluğunu ortadan kaldırmak ve her bir mikrofona sesin geliş zamanları arasındaki farkı kullanarak sesin kaynağını veya konuşmacının takibini gerçekleştirmek. Mikrofon dizilerinde, sesin elde edilmesi için dizide yer alan mikrofonların yerlerinin bilindiği kabul edilerek geliş sürelerindeki gecikmelerin, ikili çiftler halinde incelendiği genelleştirilmiş çapraz korelasyon (GÇK) tekniği kullanılmaktadır. Bu teknik kullanılır iken ses sinyalinin daha iyi elde edilebilmesi için hüzme şekillendirme işlemi yapılması gerekir. Çalışmada ses sinyalinin elde edilebilmesi hüzme şekillendirme yöntemi olarak Yönlendirilmiş Tepki Gücü (YTG) yöntemi Faz Dönüşümü (FD) ağırlık fonksiyonu kullanan GÇK metodu ile birleştirilmiştir. Bu çalışmada, beş farklı kişinin %75 oranla aynı anda konuştuğu bir ortamda konuşmacıların yerlerini 3 boyutlu uzayda bulunması hedeflenmiştir. Mikrofon dizilerine gelen seslerin kaynaklarının uzaysal konumlarının otomatik olarak belirlenmesi amaçlanmıştır. Mikrofon dizileri ile YTG-FD yöntemi kullanarak ses kaynaklarının yönlerinde hüzme şekillendirme yapılmış ve en güçlü çıkış sinyallerinin elde edildiği noktalar aranan ses kaynaklarının yeri olarak tahmin edilmiştir. İncelenecek noktaların belirlenmesi konusunda optimizasyon yöntemi olarak genetik algoritma kullanılmıştır.