Dr. Volkan Tunalı'nın Kişisel Blogu

Bilgisayar, Teknoloji, Bilim, Sanat

Archive for the ‘fonem’ tag

Türkçe için Konuşma Tanıma Sistemi

2 comments

Yüksek Lisans tezi olarak Türkçe için Konuşma Tanıma Sistemi (Speech Recognition) geliştirmeye çalıştım (2005′te).

Tezimin özeti aşağıdadır. Tamamını indirmek isterseniz tıklayın.

Tez çalışmamda Matlab geliştirme ortamını kullandım ve bunun büyük faydasını gördüm. Matlab, mühendislik ve matematik ağırlıklı uygulamalar için mükemmel bir araç.

Tez çalışmamla ilgili olarak her tür sorunuz ve görüşünüz için benimle irtibat kurabilirsiniz, bundan büyük memnuniyet duyarım. Doktora tezi olarak da bu tezimin üzerine birtakım çalışmalar yapmayı düşünüyorum, şu anda ders aşamasındayım, tez aşamasına epeyce zaman var.

————————————————————–
TÜRKÇE İÇİN KONUŞMACI BAĞIMLI, GENİŞ SÖZCÜK DAĞARCIKLI, AYRIK SÖZCÜKLÜ KONUŞMA TANIMA SİSTEMİ

Sayısal sinyal işleme teknolojisindeki gelişmeler, sinyal işlemenin ses sıkıştırma, geliştirme, sentezleme ve tanıma gibi çok değişik ve çeşitli alanlarda kullanımına yol açmıştır. Bu tez kapsamında, konuşma tanıma problemi ele alınmış ve Türkçe için konuşmacı bağımlı, geniş sözcük dağarcıklı, ayrık kelime konuşma tanıma sistemi geliştirilmiştir.

Projede, konuşma tanıma problemine iki genel yaklaşımın bir birleşimi kullanılmıştır: akustik-fonetik yaklaşım ve stokastik yaklaşım. Tanımadaki en küçük birim olarak iki durumlu Saklı Markov Modelleriyle (SMM) modellenmiş fonemler kullanılmıştır. Ses sinyalinden özellik vektörü çıkarım yöntemi olarak Mel-frekansı Kepstral Katsayılar (MFKK) tercih edilmiştir. Sistemin eğitimi aşamasında kullanılmak üzere fonem tespiti ve kesimlemesi için yeni bir algoritma geliştirilmiştir. Fonem tabanlı tanıma kullanılarak, sistemde eğitilmemiş sözcüklerin de tanınabilmesi sağlanmıştır.

Anahtar sözcükler: Türkçe konuşma tanıma, fonem tabanlı konuşma tanıma, Saklı Markov Modelleri (SMM), Mel-frekansı Kepstral Katsayılar (MFKK), ses özellik vektörü.