Dr. Volkan Tunalı'nın Kişisel Blogu

Bilgisayar, Teknoloji, Bilim, Sanat

Archive for the ‘veri madenciliği’ tag

Sosyal Ağ Analizine Giriş

leave a comment

Sosyal Ağ Analizine GirişSosyal Ağ Analizi konusuyla akademik olarak ilgilenmekteyim ve bu konuda birkaç yıldır lisans ve lisansüstü düzeyinde dersler vermekteyim. Bu birikimimi Türkçe bir eserde değerlendirmek istedim ve “Sosyal Ağ Analizine Giriş” adlı kitabımı yazdım.

Kitapla ilgili ayrıntılar şu şekilde:

Kitabın Adı: Sosyal Ağ Analizine Giriş
Yazarı: Yrd. Doç. Dr. Volkan TUNALI
ISBN: 978-605-320-516-6
Sayfa Sayısı: 200

Ayrıntılı bilgi almak için kitapla ilgili hazırladığım www.sosyalaganalizi.com sayfasını ve yayınevinin Nobel Akademik Yayıncılık sayfasını ziyaret edebilirsiniz.

Kitabı tüm internet kitap satış sitelerinde ve kitapçılarda bulabilirsiniz. Kitapla ilgili her türlü görüş ve önerinizi paylaşmanız beni çok memnun edecektir. Umarım bu kitap, daha iyilerinin yazılmasına vesile olur ve bu alandaki Türkçe kaynak eksikliğinin giderilmesi adına yararlı olur.

Kitabın tanıtım yazısı şu şekilde:

Pek çok doğal ve yapay olguda, varlıklar arasındaki ilişki ve etkileşimler incelendiğinde, çeşitli ağ yapılarının oluştuğu görülmektedir. Sosyal ağlar, ekonomik ve finansal ağlar, iletişim ağları, teknolojik ağlar, biyolojik ağlar ve kimyasal etkileşim ağları bunlardan bazılarıdır.

Bu kitap, kaynağı her ne olursa olsun, özellikle büyük ve karmaşık ağları çeşitli teknik ve araçlar kullanarak anlamaya çalışan Ağ Bilimi (Network Science) ve Sosyal Ağ Analizi (Social Network Analysis) konularına giriş yapmak isteyen öğrenci ve araştırmacılara temel bir kılavuz olması amacıyla yazıldı. Bu alanda Türkçe bir kaynak olarak önemli bir boşluğu dolduracak olması kitabın yazılmasında diğer bir motivasyon kaynağı oldu.

Kitap aynı zamanda bir dönemlik lisans son sınıf ya da lisansüstü düzeyinde, giriş niteliğinde bir ders için temel ders kitabı olmaya uygun bir içerikle hazırlandı. Kuramsal konular gereken kapsam ve derinlikte ele alındı ve tüm kavramlar çözümlü ve açıklamalı örneklerle desteklenmeye çalışıldı. Kuramsal konuların, uygulamalı çalışmalarla dengelenmesine özen gösterildi. Bölüm sonlarındaki sorularla konuların pekiştirilmesi ve öğrencilerin araştırmaya teşvik edilmesi hedeflendi.

Ağ analizinin disiplinlerarası bir konu olması nedeniyle konuya ilgi duyan hemen her alandan okuyucunun yararlanabileceği bir kitaptır. Ayrıca, ağ analizi yazılımlarının kullanımları ve dosya formatlarıyla ilgili verilen bilgi, öneri ve ipuçları da uygulama çalışmalarında yararlı olacaktır.

DataMiningResearch.com

leave a comment

Data MiningDoktora tezimle ilgili olarak Veri Madenciliği ve özellikle Metin Madenciliği üzerinde çalışmalar yapmaktayım. Araştırmalarım ve tez projemin geliştirilmesi sırasında ilginç ve yararlı bulduğum çeşitli makalelere, araçlara ve kaynak kodlara rastlıyorum. Bulduğum bu şeyleri ve de araştırma alanımla ilgili düşünce ve çalışmalarımı paylaşmak amacıyla İngilizce içerikli olarak  DataMiningResearch.com sitesini kurdum. Önümüzdeki günlerde bu siteye Türkçe içerik eklemeyi de düşünüyorum. Veri Madenciliği, Bilgi Keşfi ve Makine Öğrenmesi alanlarına ilgi duyanlar için yararlı bir site olmasını umuyorum.

Written by vtunali

Ekim 29th, 2010 at 12:55 am

Veri Madenciliği (Data Mining) Kitapları

leave a comment

Veri Madenciliği (Data Mining) ve Metin Madenciliği (Text Mining) alanlarında doktora araştırma ve tez çalışmalarımda kullandığım ve içeriğini çok yararlı bulduğum bazı kitapları burada tanıtmak istiyorum. Bunların bir çoğunu e-book olarak bulmak mümkün (tabii ki ben bunlara bağlantı vermeyeceğim). Şimdilik 3 tanesini yazdım, devamı gelecek.

Data Mining: Concepts and Techniques, Second Edition


Kitap Adı: Data Mining: Concepts and Techniques, Second Edition
Yazarları: Jiawei HanMicheline Kamber
Yayınevi: Morgan Kaufmann Publishers

Veri Madenciliği alanında en çok bilinen kitap bu olsa gerek. Bu alana bir başlangıç yapmak isteyenlere tavsiye ederim.









Introduction to Data Mining


Kitap Adı: Introduction to Data Mining
Yazarları: Pang-Ning TanMichael SteinbachVipin Kumar
Yayınevi: Addisson-Wesley

Kitapla ilgili ayrıntılı bilgi ve örnek bölümlere .pdf formatında erişim için http://www-users.cs.umn.edu/~kumar/dmbook/index.php adresini ziyaret edebilirsiniz. Bu adreste ayrıca kitapla ilgili çeşitli sunular da yer almaktadır.







Grouping Multidimensional Data: Recent Advances in Clustering


Kitap Adı: Grouping Multidimensional Data: Recent Advances in Clustering
Yazarları: Jacob KoganCharles NicholasMarc Teboulle (Editörler)
Yayınevi: Springer

Kümeleme alanında çeşitli güncel makalelerin derlenmesiyle oluşturulmuş bir kitap.










Written by vtunali

Kasım 12th, 2009 at 12:43 am

Metin Madenciliği (Text Mining) Nedir?

3 comments

Veri madenciliği üzerine yapılan çalışmalar çoğunlukla ilişkisel veritabanı ve veri ambarlarındaki veriler gibi yapısal veriler üzerine odaklanmış durumdadır. Ancak gerçekte erişilebilir ve kullanılabilir durumdaki verinin önemli bir bölümü metin veritabanlarında veya diğer ifadesiyle doküman veritabanlarında bulunmaktadır. Bu veritabanları genellikle haberler, makaleler, araştırma bildirileri, kitaplar, sayısal kütüphaneler, e-posta iletileri ve Web sayfaları gibi çeşitli kaynaklardan oluşan geniş doküman koleksiyonlarından oluşmaktadır. Elektronik ortamdaki bilgi miktarındaki artış nedeniyle metin veritabanlarının boyutları da hızla artmaktadır. Tahminlere göre iş dünyasına ilişkin bilginin %85′i metin formunda saklanmaktadır.

Metin Madenciliği (Text Mining), yararlı, ilginç ve daha önce bilinmeyen bilginin, bilgi işlem metodları ve teknikleri ile metin halindeki veriden elde edilmesi olarak tanımlanabilir. Metin Madenciliği, veri madenciliği, yapay zeka, doğal dil işleme (NLP Natural Language Processing), istatistik, bilgi erişim (IR Information Retrieval) ve bilgi yönetimi (Knowledge Management) tekniklerini kullanarak “bilgi patlaması” (information explosion / information overload) sorununa çözüm bulmayı amaçlayan bir araştırma alanıdır. Metin Madenciliği, doküman koleksiyonlarının önişlemeden geçirilmesi, ara sonuçların saklanması, ara sonuçların analiz edilmesi için çeşitli tekniklerin kullanılması ve nihai sonuçların görselleştirilmesi gibi aşamalardan oluşmaktadır.

Metin Madenciliği teknikleri dört temel kategoriye ayrılır: sınıflandırma (classification), birliktelik analizi (association analysis), bilgi çıkarım (information extraction) ve kümeleme (clustering). Sınıflandırma işlemi nesnelerin daha önceden bilinen sınıflara ya da kategorilere dahil edilmesidir. Birliktelik analizi ise sıklıkla birlikte yer alan ya da gelişen sözcük ya da kavramların belirlenmesi ve böylece doküman içeriğinin ya da doküman kümelerinin anlaşılmasını amaçlamaktadır. Bilgi çıkarım teknikleri ile dokümanların içerisindeki yararlı veri ya da ifadeler bulunmaya çalışılmaktadır. Kümeleme analizi, doküman kümelerinin temelini oluşturan yapıların keşfedilmesi amacıyla uygulanmaktadır.

Written by vtunali

Ekim 28th, 2009 at 1:56 pm