Mengü G.(Yürütücü), Kemaloğlu Y. K., Gökdoğan Ç.
TÜBİTAK Projesi, 2015 - 2017
Konuşma başta olmak üzere her türlü
ses sinyalinin üç boyutlu olarak görselleştirilmesini hususunun ele alındığı bu
projenin temel amacı; tek bir yazılım içinde konuşmayı zaman-frekans-genlik
temelinde analiz edip bunu üç boyutlu baskı yapabilen bir baskı cihazında basılacak
formatta bir dosya haline getirmek ve bu arada da bunun yapılabildiğini somut
olarak ortaya koymak için Türkçenin 32 sesbiriminin (foneminin) üç boyutlu
baskısını yapmaktır.
Elde edilen ürünlerin sonraki
çalışmalarda dilbilimsel olarak Türkçe’nin segmental ve suprasegmental yapısını
anlamayı sağlayacak somut veriler üreteceği beklentisi ötesinde; tıbbi,
özellikle de odyolojik amaçlarla ve konuşma bozukluklarının
değerlendirilmesinde kullanılabilmesi için yazılımın içine bir frekans filtre
sistemi ve odyolojik olarak işitme kayıplarının konuşma örneklerini ne şekilde
etkilediğini değerlendirmeyi sağlayacak özel bir analiz ve filtre sistemi (frekans-şiddet
temelli dBA filtresi de dahil olmak üzere) eklenmiştir.
Bu şekilde incelenen konuşma veya
ses örneklerini üç boyutlu olarak görselleştirirken dBA filtresine göre
sağlıklı toplum tarafından özellikle alçak frekanslarda rahatça duyulan kısımlarını
duyulmayan kısımdan ayırt etmek ve odyolojik amaçlı olarak da (örneğin işitme
cihazı veya koklear implant “fitting” çalışmaları sırasında) bireyin işitme
kaybını konuşma örneklerine yansıtıp duyulan (özellikle alçak frekanslardaki) konuşma
kısımlarını görebilmek mümkündür.
Gazi Üniversitesi’nde 21 ayda tamamlanan bu proje, TÜBİTAK tarafından desteklenmiştir.
ÖZET
Konuşma
farklı frekanslarda ve genliklerdeki ses dalgalarının birbirine eklemlenmesiyle
oluşan kompleks bir sestir. Gerek en küçük anlamlı konuşma sesbirimi (fonem) gerekse
bunların peşpeşe üretilmesinden ibaret olan hece, sözcük ve cümleler, zamanda
akıp giderken içerik ve suprasegmental bilgileri zaman-frekans-genlik (zfg)
olarak kodlayabilmektedir. Bu sayede insanoğlunun en kompleks bilişsel
süreçlerinden birisi olan dil, konuşmaya yansımaktadır.
Ancak
mevcut olan yazılımlardan hiçbirisi konuşmanın zfg üçlüsünü, üç boyutlu bir
modele dönüştürüp basacak teknik özelliklere sahip değildir. Konuşmanın elle
tutulur, tutulmasa da görsel bir nesne gibi şekillendirilip incelenebilir
olması, sadece dilbilimsel çalışmalar için değil, özellikle odyolojide işitme cihazı
uygulamaları ve her türlü konuşma bozukluklarının değerlendirilmesi için bugüne
kadar hiç kullanılmamış farklı bir analiz yolu sağlayacaktır. Amaç; bu şekilde
bir yazılım üretmek ve yapılabildiğini somutlaştırmak bağlamında da Türkçenin
32 sesbirimini modellemektir.
Öncelikle
deneğimiz International Phonetic Association’a göre Türkçenin 32 sesbirimi
örnek sözcükler ile, ayrıca 8 ünlü sesbirimi izole üretmiş ve “.wav” dosyaları olarak
kaydedilmiştir. Deneğin ses kalitesi ve konuşma ayırt edilebilirliğinin yeterliliği
saptanarak 8 izole ünlü ve 24 ünsüzün kayıtları modelleme için seçilmiştir.
Ses/konuşmayı
zaman-genlik, genlik-frekans ve üç boyutlu spektogram olarak inceleyen, frekans filtreleri içeren Türkçe bir yazılım
oluşturulmuştur; “.wav” dosyasını üç boyutlu baskı (“.stl”) formatına
dönüştürecek uygulama eklenmiştir. Ayrıca “.wav” dosyasını dBA filtresinden
geçirerek rahat duyulan kısmı ayıran bir filtre ve odyolojide incelenen
frekanslardaki enerjiyi hesaplayıp dB-HL’e çeviren ve hastanın işitme kaybı
profiline göre geriye kalanı gösteren bir odyolojik uygulama eklenmiştir.
Seçilen 32
“.wav” dosyası kesilmiş ve 20-20000 Hz filtresinden geçirilerek basılacak asıl
model elde edilmiş; daha sonra dBA filtrelerinden geçirilerek rahat duyulan kısım
ayırt edilmiş ve ayrı renklendirilerek modeller seramik esaslı olarak
basılmıştır.
Sonuç
olarak ses ve konuşmayı hem alışılmış şekilde analiz edip hem de üç boyutlu bir
baskı cihazında basılacak hale getiren ve dolayısıyla da üç boyutlu bir görsel
haline çeviren bir program üretilmiş ve Türkçenin 32 sesbiriminin üç boyutlu
görseli (heykelleri) üretilmiştir.
Anahtar sözcükler: Ses,
konuşma, spektrogram, ses analizi, konuşma bozuklukları, üç boyutlu ses
analizi, konuşma analizi, odyoloji, özel eğitim, üç boyutlu baskı