Dr. Volkan Tunalı'nın Kişisel Blogu

Bilgisayar, Teknoloji, Bilim, Sanat

Archive for the ‘veritabanı’ tag

Bilgisayar Bilimine Giriş (Computer Science: An Overview)

leave a comment

Bilgisayar Bilimine GirişÇeviri kurulunda yer aldığım bir kitabı tanıtmak istiyorum.

J. Glenn Brookshear ve Dennis Brylow tarafından yazılmış olan Computer Science: An Overview kitabın 12. baskısının çeviri kurulunda yer aldım. Bölüm 11. Yapay Zeka bölümünün çevirisi bana ait. Bilgisayar bilimi alanında iyi bir kitabın güzel bir çevirisi oldu. Okuyuculara yararlı olacağını umuyorum.

Kitapla ilgili ayrıntılar şu şekilde:

Kitabın Adı: Bilgisayar Bilimine Giriş
Çeviri Editörü: Yrd. Doç. Dr. Birim Balcı Demirci
Çeviri Kurulu: Birim Balcı Demirci, Coşkun Çelik, Emine Sezer, Hacer Karacan, Hakan Kutucu, Hasan Dağ, Okan Bursa, Özgü Can, Resul Kara, Selim Bayraklı, Şenol Zafer Erdoğan, Volkan Tunalı
ISBN: 978-605-320-361-2
Sayfa Sayısı: 628

Ayrıntılı bilgi almak için ilgili Nobel Akademik Yayıncılık sayfasını ziyaret edebilirsiniz.

Kitabın tanıtım yazısı şu şekilde:

Bilgisayar Bilimine Giriş kitabı, gerek Bilgisayar Mühendisliği gerekse diğer mühendislik alanlarındaki öğrenciler ve alana ilgi duyan diğer okuyucular için Bilgisayar Bilimleri hakkında kapsamlı bir bakış kazandırmak için yazılmıştır.

Okuyuculara bilgisayar bilimlerine dair işlevsel bir anlayış kazandırmak amacıyla yazılan bu kitap, her bölüm ile ilgili olarak okuyucuların kendilerini deneyebilecekleri Sorular ve Alıştırmalar, Bölüm Tekrar Problemleri ve Sosyal Konular olmak üzere üç farklı kapsamda sorular içermektedir.

Orijinali J. Glenn Brookshear ve Dennis Brylow tarafından kaleme alınan ve on ikinci baskısı yapılan bu kitap, Bilgisayar Mühendisliğine Giriş, Bilgisayar Bilimlerine Giriş gibi mühendislik alanlarında okutulan temel bilgisayar derslerinde yararlanılabilecek önemli bir kaynaktır.

Database Smells

leave a comment

Programlamada “code smells” olarak bilinen bir kavram vardır: artık refactor (yeniden düzenleme) edilme zamanı gelmiş olan kod kendini belli etmeye başlar. Örneğin çok uzun metodlar, kopyala-yapıştır ile çoklanmış kod blokları kötü kokmaya başlar, temizliğe gerek vardır.

Scott Ambler ve Pramod Sadalage, “Refactoring Databases: Evolutionary Database Design” isimli kitaplarında veritabanı tasarımına “Database Smells” diye bir kavram getirdiler. Aşağıda, bir veritabanının yeniden düzenlemeye ihtiyacı olduğunun bazı göstergelerini kısa maddeler halinde bulacaksınız.

  • Çok amaçlı kolon: Eğer bir kolon birden çok amaçla kullanılıyorsa, muhtemelen o kolonu anlamlandırmak için kod tarafında ekstra çaba sarfediliyordur ve muhtemelen bu iş diğer bazı kolonlardaki değerlere bağlı olarak yapılıyordur.
  • Çok amaçlı tablo: Benzer şekilde, çeşitli türdeki varlıkları aynı tabloda saklamaya çalışmak da tasarımda bir kusur olduğunun göstergesidir.
  • Çoklanmış veri: Aynı verinin veritabanın bir çok yerinde bulunması zaman içerisinde tutarsızlıklar oluşmasına yol açabilir.
  • Çok fazla kolonu olan tablo: Bir tabloda çok fazla kolon olması genellikle o tabloda çeşitli türlerde varlıklara ait veri tutulmaya çalışılmasından ileri gelir.
  • Çok fazla satırı olan tablo: Büyük tablolar performans sorunlarını da beraberinde getirir. Mümkün ise bazı kolonların ya da bazı satırların başkta tablolara dağıtıldığı bir tasarıma gidilmesi ciddi performans kazancı sağlayacaktır.
  • Akıllı kolon: Akıllı kolon, kolon verisinin değişik bölümlerinin değiişik anlamlara geldiği kolonlardır. Örneğin, müşteri numarasının ilk 4 hanesi müşteri grubunu, sonraki 2 hanesi kayıt yılını vs. gösteriyor olabilir. Bazen de bir kolonda komple XML olarak veri tutuluyor olabilir. Ancak bu tür kolonlarda ayrıntılara inmek ekstra işlemlerin yapılmasını gerektirir. En iyisi bu tür kolonları yeniden organize etmektir.
  • Değiştirmekten korkmak: Eğer veritabanı şemasında bir değişiklik yaparak birşeyleri bozmaktan korkuluyorsa, o veritabanının yeniden düzenlenme zamanı gelmiştir. Eğer bu yapılmazsa, ileriye dönük olarak işler sadece daha da kötüleşecektir.

Ambler ve Sadalage, kitaplarında bu kötü kokular için yeniden düzenleme tekniklerini hem veritabanı şeması olarak hem de SQL ve çeşitli dillerde kod örnekleriyle anlatıyorlar.

Kaynak: “Refactoring Databases: Evolutionary Database Design“, Scott Ambler & Pramod Sadalage.

Written by vtunali

Kasım 21st, 2009 at 9:40 pm

Primary Key: Identity mi GUID mi?

leave a comment

Birincil Anahtar (Primary Key) olarak ne kullanılması gerektiği veritabanı tasarımında en sık karşılaşılan ve çözümü de çok kolay olmayan bir sorundur. Aslında veritabanı teorisi açısından en doğrusu Doğal Anahtar (Natural Key) olan kolonun birincil anahtar olarak kullanılması. Ancak pratikte bunun çeşitli sakıncaları bulunduğu için pek tercih edilmiyor. Günümüzün Nesne Yönelimli (Object Oriented) tasarımlarıyla daha iyi örtüştüğü için Doğal anahtar yerine Surrogate Key (harici, vekil anahtar) kullanımı daha çok tercih ediliyor. Özellikle de ORM (Object Relational Mapping) gibi veri ve iş mantığı katmanlarının kullanıldığı yazılım projeleri için Surrogate Key tek seçenek durumunda.

Surrogate Key’i kısaca tanımlamak gerekirse; kayıtlardaki veriyle hiçbir doğal bağlantısı ve ilgisi olmayan, tek amacı kayıtları eşsiz olarak nitelemek olan, genellikle de değerini veritabanı sisteminin kendisinin ürettiği tablo kolonudur. Çoğunlukla bu kolonun veri tipi olarak otomatik artan (Auto Increment, Identity, Sequence gibi) Integer ya da GUID (Globally Unique Identifier = Küresel Eşsiz Tanımlayıcı) tercih edilmektedir. İşte asıl sorun da bu noktada yaşanmakta: Bu ikisinden hangisini seçmeli ve neden? Ne yazık ki bu sorunun tek ve kesin bir yanıtı yok. Tasarlanmakta olan sistemin bugünkü ve de öngörülebilen gelecek ihtiyaçlarına bağlı olarak bir tercih yapılması gerekiyor. Bu tercihi yaparken her iki seçimin de avantaj ve dezavantajlarını ortaya koymak ve bunları iyi değerlendirmek gerekiyor. Bu makalede her iki veri tipini ayrı ayrı ele alacağız ve bir sonuca ulaşmaya çalışacağız.

GUID – Globally Unique Identifier

+ Bu veri tipinin en büyük avantajı evrensel olarak (ve en azından teoride) eşsiz değerlere sahip olması. Sadece bir tablodaki bütün satırlar değil, veritabanındaki tüm satırlar, hatta ve hatta evrendeki tüm tablolardaki tüm satırlar eşsiz kimliğe sahip olacak.

+ Eşsiz olma özelliğinden dolayı dağıtık durumdaki veritabanlarını bir gün gelip de merkezi hale getirmek gerektiğinde yani merge etmek (birleştirmek) gerektiğinde hiçbir sorun yaşanmadan, hiçbir dönüşüme gerek kalmadan bu işlem gerçekleştirilebilir. Dolayısıyla bu veri tipinin tercih edilmesinde kurulan sistemin böyle bir gereksinime cevap verebilir olmasının gerekliliği en önemli etkendir. (Örneğin MSSQL Server’da replikasyon yapıldığında eğer yok ise sistem her tabloya bir adet GUID kolon ekliyor.)

+ Programsal olarak üretilebildiği için veritabanına Insert işlemi sırasında değeri bilinebilir ve böylece Insert’ten sonra bir kez de en son kullanılmış değeri elde etmek için veritabanı sunucusuna bir erişime daha ihtiyaç duyulmaz. ORM açısından da bunun güzel bir özellik
olduğu düşünülebilir.

- GUID’nin en büyük dezavantajı veri boyutunun çok büyük olmasıdır. GUID’nin boyutu 128 bit = 16 byte’tır. Birincil anahtar olarak GUID kullanılan bir tablodaki diğer bütün index’lerin de bu 16 byte’ı taşıyacağı anlamına gelir. Sonuç olarak fazladan veritabanı boyutu ve disk alanı demektir. Elbette ki fazladan I/O işlemi = performans sıkıntısı.

- Veritabanı açısından değil belki ama yazılım geliştiriciler açısından B85E62C3-DC56-40C0-852A-49F759AC68FB gibi değerlerin debug etme işini epeyce zorlaştıracağı da bir gerçek.

- Çoğu veritabanı yönetim sistemi artık GUID veri tipini kendiliğinden destekliyor olsa da bunu doğal olarak desteklemeyen sistemlerde karakter veri tipi olarak tutulması gerekebilir (gerçek bir uygulamada böyle yapılmak zorunda kalındığını biliyorum).

- GUID’ler üretildiklerinde belli bir sıra takip etmezler, yani tamamen rastgele üretilirler. Yani, sonradan üretilen GUID, bir önceki GUID’den daha büyük olmak zorunda değildir. Bu durum bize Clustered Index şeklindeki birincil anahtar olarak tanımlanan GUID kolonlarda büyük bir
dezavantaj oluşturmaktadır. Bildiğiniz gibi Clustered Index demek, verilerin bu index’e göre veritabanı sayfaları üzerinde gerçekten doğal sırasıyla tutulması anlamına geliyor. Yani Clustered olmayan indexler gibi sadece index olmaktan ibaret değil. Bu durumda her sırasız Insert için tabloya ait sayfalarda yer değiştirme ve yer ayırma yapılması gerekiyor. Bu soruna çözüm olarak mesela MSSQL Server 2005′ten itibaren Sequential GUID gibi -bence zorlama ve uydurma- veri tipleri gelmekte ya da sıralı GUID üreten fonksiyonlar yazılmakta. Ek olarak, GUID türündeki birincil anahtarların Clustered yapılmaması da dikkat edilmesi gereken bir konu.

Identity Integer

+ Eğer 4 byte’lık Integer veri tipi kullanılırsa işlemci için en doğal ve en hızlı işlenen veri tipi olması bakımından ilişkisel veritabanı operasyonları için en uygun veri tipi olduğu söylenebilir.
16 byte genişliğinde GUID veri tipiyle kıyaslandığında veritabanı ve disk alanı bakımından da son derece avantajlı olduğu görülüyor.

+ Sıralı üretildikleri için GUID’deki Clustered Index problemi yaşanmıyor.

+ Program geliştiriciler için debug edilmesi, gözle takip edilmesi son derece kolaydır.

- Kayıt Insert edildikten sonra son üretilen Identity değeri elde etmek için sunucuya fazladan bir erişim yapmak ve işlem yaptırmak gerekiyor.

- Ayrık veritabanlarını merkezi olarak birleştirmek gerektiğinde çakışan değerler için ekstra uğraş gerekiyor.

Sonuç ve Değerlendirme

Dağıtık veritabanlarının replike edilmesi ya da merkezileştirilmesi gibi ihtiyaçlar söz konusu ise GUID büyük boyutuna ve diğer dezavantajlarına rağmen en iyi seçenek gibi görünüyor. Bunun dışında, 32 bit ya da gerçekten gerekli ise 64 bit Integer Identity şeklindeki Surrogate Key daha az masraflı, daha fazla sistem tarafından doğal olarak desteklenen ve daha pratik bir seçenek durumunda. Bu aşamada kişisel bir tercih belirtmem gerekirse mutlaka gerekmiyorsa GUID’den uzak durmayı seçiyorum.

Written by vtunali

Kasım 18th, 2009 at 12:13 am

Bozuk SQL Server Veritabanı Kurtarma

7 comments

Zaman zaman müşterilerimizin MS SQL Server 2000 veritabanı dosyalarında bozulmalar oluyor. Çoğunlukla bu bozulmaları DBCC CHECKDB komutuyla tamir etmek mümkün oluyor. Ancak bazen öyle bozulmalarla karşılaşıyoruz ki CHECKDB bile yapılamıyor. Böyle durumlar için kullandığımız ve her zaman işimize yaramış bir prosedür önereceğim. Gün gelir hayat kurtarıcı olabilir.

0- Bozuk veritabanının detach edilmiş olduğunu varsayıyoruz öncelikle.

1- Aynı isimle boş bir database oluşturun.

2- select status from sysdatabases where name= 'db_name' ile yeni yaratılan database’in durumunu kontrol edin. Dönecek değer “1077936153″ gibi bir değerdir. (db_name:Yeni yaratılan database’in adı)

3- Database’in durumunu Emergency (bypass recovery) moduna geçirmek için sysdatabasestablosunda database’in status bilgisini değiştirmek gerekir.
Bunun için (sysdatabases tablosunda update yapabilmek için) şu satırları çalıştırın:
–> sp_configure 'allow update',1

–> Reconfigure WITH OVERRIDE

4- update sysdatabases set status = -32768 where name='db_name' ile status değerini değiştirin.

5- SQL Server servisini durdurun.

6- Bozuk data dosyasını boş data dosyası uzerine kopyalayın. Yeni database’in log dosyasını silin.

7- SQL Server servisini çalıştırın.

8- DBCC rebuild_log('db_name','c:\data\....._log.ldf') satırını çalıştırın.

9-Warning: The log for database ‘test’ has been
rebuilt. Transactional consistency has been lost. DBCC CHECKDB should
be run to validate physical consistency. Database options will have to
be reset, and extra log files may need to be deleted
.” mesajını alırsınız.

10- Daha sonra dbcc checkdb('db_name') komutunu çalıştırın.

11- Database DBA use only modundadır. Özellikler->Options bölümünden restrict access check’ini kaldırın.

12- Şu satırları çalıştırın:
–> sp_configure 'allow update',0
–> reconfigure WITH OVERRIDE

13- Database’iniz kullanıma hazır olacaktır.

Komutların doğru sırası aşağıdaki gibi izlenmeli :

sp_configure 'allow updates',1
go

reconfigure with override
go

update sysdatabases

set status=-32768 where dbid=DB_ID(‘db_name’)
go

sp_configure ‘allow updates’,0
go

reconfigure with override
go

dbcc rebuild_log(‘db_name’,'c:\data\DB0001_log.ldf’)

go

dbcc checkdb(‘db_name’)
go

Written by vtunali

Ekim 28th, 2007 at 1:59 pm