Dr. Volkan Tunalı'nın Kişisel Blogu

Bilgisayar, Teknoloji, Bilim, Sanat

Archive for the ‘speech recognition’ tag

Konuşma Tanıma Mı Konuşmacı Tanıma Mı?

4 comments

Konuşma Tanıma ile ilgili benim yüksek lisans tezim ve Konuşmacı Tanıma ile ilgili Ozan Mut’un yüksek lisans tezini sitemde yayınlamaya başladığım günden bu yana sıklıkla üniversite öğrencilerinden ve bazen de profesyonellerden bu iki konuyla ilgili çok sayıda bilgi talebi ve proje için yardım isteği alıyorum. Bugüne kadar bana ulaşan hiç kimseyi geri çevirmedim. İş ve doktora çalışmalarımın yoğunluğu nedeniyle fazlaca yardımcı olamadıysam bile en azından fikir vermeye çalıştım, isteyen herkese de yüksek lisans projemin Matlab kodlarını olduğu gibi gönderdim. Bu konularda yardıma ihtiyacı olan herkese yine elimden geldiğince yardımcı olmaya devam edeceğim.

Bu yazıyı yazmaya neden ihtiyaç duyduğuma gelince. Bana bilgi ve yardım için ulaşanların çok az bir kısmı hangi amaçla, ne kadar kapsamlı ve ne tür bir proje yapmakta olduğunu, ne tür bir yardıma ihtiyacı olduğunu belirtiyor. Büyük çoğunluk ise sanıyorum ki iki farklı tez yayınladığımdan dolayı yanılgıya düşerek benim projemle ilgisi olmayan Konuşmacı Tanıma’yla ilgili bir çalışma için yardım istiyor. Gelen isteklerin bir bölümü de teslim gününe çok az kalmış okul projeleri için çalışan örnek kod şeklinde oluyor.

Öncelikle şunu iyi ayırdetmek lazım. Konuşmacı Tanıma (yani Speaker Recognition) sisteminin amacı konuşan kişiyi tanımlamak, sisteme tanıtılmış bir grup kişinin sesi arasından test edilen sesin kime ait olduğunu ortaya çıkartmaktır. Konuşma Tanıma (yani Speech Recognition) sistemi ise belirli bir kişi tarafından söylenmiş olan bir ifadenin metin karşılığını elde etmeye çalışır. Ses sinyalinin işlenmesi vb. temel prensiplerde benzer olsalar da bu ikisi birbirinden çok farklı amaçları ve çalışma prensipleri olan sistemlerdir.

Benim yüksek lisans tezim Konuşma Tanıma ile ilgilidir. Bu konuda çalışacak kişilere elimdeki her türlü kaynak kitap, makale, Matlab toolbox’ları ve projemin kaynak kodlarını memnuniyetle verebilirim [28.10.2010 Ek bir açıklama yapayım: Tezimin referanslarında yer alan kitapları sanıyorum ki artık e-book olarak bulmak mümkün. E-book bulamazsanız, orijinal kitapları ben Boğaziçi Üniversitesi'nin kütüphanesinden temin etmiştim. Eğer oradan da bulma imkanınız olmazsa ben elimdeki fotokopi halindeki kitapları kısa süreli olarak ödünç verebilirim].

Konuşmacı Tanıma konusunda yardıma ihtiyacı olanların Ozan Mut’a ulaşmasını rica ediyorum. Eğer iletişim kuramıyorsanız bana ihtiyaç duyduğunuz şeyleri ayrıntılı olarak yazarsanız Ozan Mut’a iletmeye çalışırım. [06.02.2012 Ek açıklama: Ozan Bey uzun süredir bu alanla ilgilenmediği ve işlerinin yoğunluğu nedeniyle bu konudaki soru ve istekleri kendisine yönlendirmememi istedi, dolayısıyla lütfen bu konuda benden istekte bulunmayın].

Bilgi ve yardıma ihtiyaç duyduğunuz konuda lütfen şunları belirtmeyi unutmayın:

  • Hangi okul ve bölümde öğrencisiniz?
  • Hangi amaçla bir proje yapıyorsunuz? Dönem projesi mi? Bitirme projesi mi? Yüksek Lisans projesi mi?
  • Projenizi hangi ortamda geliştiriyorsunuz? Matlab mı? C++ mı? Başka birşey mi?
  • Şu ana kadar yaptığınız çalışmada hangi noktaya geldiniz ve o nokta itibariyle nasıl bir yardıma ihtiyacınız var?
  • Projeniz için teslim zamanı nedir? Son dakikada birşeyler yapıp teslim etme derdinde misiniz? Yoksa makul bir sürede ciddi bir çalışma üzerinde misiniz?

Bu bilgiler verilmediği zaman yardımcı olabilmek için bu bilgileri istemek üzere karşılıklı bir e-posta trafiği başlatmak zorunda kalıyorum. Bu da iki taraf için ciddi bir zaman kaybı oluyor.

Şu anda tamamen farklı bir alanda doktora çalışması yaptığım için yüksek lisans projemin Matlab kodlarıyla ilgili ayrıntılı bilgi verebilecek, uzun açıklamalar yapabilecek ve çarçabuk basit ve çalışan bir örnek çıkartabilecek durumda değilim. Tezimde yeterince ayrıntı var. Bir miktar Matlab bilgisiyle kodlar üzerinden epeyce şey öğrenilebilir.

Bu alanların birinde çalışma yapan herkese başarılar diliyorum. Kolay gelsin.

Written by vtunali

Ocak 24th, 2010 at 1:53 am