OLAP hakkında genel bir bilgi veren güzel bir yazı. Kaynak: http://www.danismend.com/kategori/altkategori/olap-1/
Her işin tek tuşa basılarak hazırlandığını sanan patronunuz, günlerce uğraşarak hazırladığınız raporunuzda, “Bir de rapora, 3 ay öncesiyle karşılaştırmalı bakalım” veya “Bir de tüm bu verileri, ürün tipi kırılımında inceleyelim” derse ne yaparsınız? İşleriniz devamlı bu şekilde güncellemeler, asla bitmeyen raporlarla mı geçiyor? O zaman OLAP nedir mutlaka öğrenmelisiniz.
OLAP nedir ?
İlişkisel veri tabanlarının yaygınlığı ve sonrasında ortaya çıkan Veri Ambarlarının gelişmesi ile beraber, verilere daha hızlı şekilde erişme ve çok boyutlu analiz ihtiyaçları, bilim adamlarını ve yazılım şirketlerini, daha farklı yapılar geliştirmeye itmiştir.
Bu amaçla geliştirilen bir teknoloji olan OLAP (On-line Analytical Processing), ilişkisel veri tabanları gibi, bilimsel temeller üzerine değil, OLAP ürünleri üreten firmaların desteğinde çıkan bir teknoloji olmuştur. Bu nedenle, veri tabanları, ilişkisel veri tabanları ve hatta veri ambarları üzerine birçok akademik yazı bulunmasına rağmen, OLAP üzerine genellikle, ürün dökumanları ve şirketlerin tanıtım yazıları bulunabilmektedir.
OLAP terimini ilk olarak ortaya çıkışı ise, 1993 yılında, Dr. E.F.Codd ’un ortaya koyduğu kurallar çerçevesinde olmuştur. Bu yazı, OLAP için bir temel oluştursa da, kimi çevrelere göre, o yıllarda Arbor Software (Şimdiki Hyperion Solutions) için bir white paper olmaktan öteye gidememiştir.
Bu yazıya göre, bir veri yapısının OLAP olarak nitelendirilebilmesi için 12 kural belirlenmiştir. Bu kurallar sırası ile:
- Çok boyutlu inceleme özelliğine sahip olması,
- Şeffaflık,
- Erişilebilirlik,
- Her seviyede sorgulama için aynı performansı gösterebilme özelliği,
- İstemci-Sunucu yapısında olması,
- Sınırsız şekilde çarpraz raporlama olanağının olması,
- En alt seviyedeki verilerin otomatik olarak ayarlanması,
- Her şarta uygun boyutlandırılabilirlik,
- Çok kullanıcı desteğinin olması,
- Her seviyede verilerin değiştirilebilir olması,
- Esnek raporlama özelliği,
- Boyut ve gruplamalarda sınır olmaması.
Kullanılan sektörler/alanlar nelerdir?
OLAP, yöneticiler ve analistlerin, verilere çok hızlı şekilde, farklı açılardan bakabilmelerini sağlayan bir yapıdır. “Kim?” ve “Ne Zaman?” sorularından başka, “Neden?” ve “Eğer şu olursa…” sorularının da yanıtını verir. (Ör : Eğer şeker fiyatları 5% lira ve taşıma maliyetleri 10% düşerse, yıllık ve çeyrekler bazında kârlılık ne olur gibi.)
Akıllı raporlama araçları sayesinde, neden sorularının cevapları da kolaylıkla alınabilmektedir. Genel eğilimden farklılık gösteren, uç değerler yaratan elemanları birçok analiz aracı, sayısal detaylara girmeden, sadece renklerle bile görüntüleyebilmektedir.
OLAP’ı sadece büyük özet tablolar gibi yorumlamak pek doğru değildir. Excel kullanıcıların yakından tanıyacakları Pivot tabloların, çok gelişmiş ve hızlı bir hali olarak gözönüne getirmek daha doğru olacaktır. Tasarlanan bir OLAP yapısının, hiyerarşilerini ve boyutlarını görmek mümkün olsa da, verileri nasıl tuttuğunu, 2 veya grafikler olarak göstermek mümkün değildir, ancak iç içe geçmiş küpler olarak yorumlanabilir. Bu nedenler OLAP yapılarına, “küp” adı verilmektedir.
Bir veri ambarınızın olması, OLAP’a ihtiyacınız olmadığı anlamına gelmez. Veri Ambarları ve OLAP birbirlerinin tamamlarlar. Veri Ambarı verileri uygun şekilde tutmaya ve kontrol etmeye yarar. OLAP ise, DW verilerini stratejik bilgilere dönüştürmeye yarar.
Bir şirket yapısı içerisinde, departmanlar bazında inceleyecek olursak;
Pazarlama departmanlarında OLAP’ın en yaygın kullanım alanları, pazar araştırmalarında, satış tahminleri, promosyon ve kampanya analizleri, müşteri analizleri ve Pazar/Müşteri segmentasyonlarıdır. Data Mining sonuçlarının değerlendirilmesi ve demografikler bazında incelenmesi seviyesinde de olmazsa-olmaz araçlardan biri olarak yer almaktadır.
Üretim ile ilgili uygulamaları ise en yoğun olarak üretim planlama ve hata analizleridir. Özellikle senaryogeliştirmekte ve farklı ürün tipleri ile çalışılan yapılarda, çok boyutlu düşünme imkanı sayesinde maliyetler ve fiyatlamalar, kolaylıkla çıkarılabilmektedir.
Finans Departmanları ise OLAP’ı bütçeleme, Activity-Based Costing, finansal performans analizleri ve finansal modelleme amaçları ile kullanabilir. Özellikle konsolidasyon konusunda yaratılacak modeller, çok büyük kolaylıklar sağlamaktadırlar. Strateji belirleme, Satış analizleri ve gelecek tahminleri ise, satış departmanlarındaki OLAP uygulamadır.
OLAP’ın özellikleri
Zaman kazancının dışında, OLAP 3 çok önemli özelliği de beraberinde getirmektedir.
Verilere çok boyutlu bakabilme özelliği :
Analizler sırasında kullanmış olduğumuz, her türlü kırılıma boyut adını verebiliriz. Örneğin demografik veriler (yaş, cinsiyet, eğitim durumu), sayısal veriler, adetler, işlem miktarları, gerçekleşen ve bütçelenen değerler, ürün tüpleri, ürün özellikleri ve zaman. Yöneticiler ve analistler, çalışmaları sırasında, tüm bu tanımlanan verileri yatay veya düşey eksenlerde çakıştırarak görmek isteyebilirler.
İlişkisel veri tabanları, bu şekilde raporlara izin vermezler, fakat raporlama araçlarının yetenekleri ile, belirli bir noktaya kadar tolere edilebilir. Fakat daha karmaşık analizler işin içine girdiğinde, bir olap yapısı kurmadan bu raporları almak imkansız hale gelebilir.
İlişkisel veri tabaları üzerinde karmaşık SQL kodları yazmak, ya da raporlama aracının sahip olduğu programlama dili üzerinde uğraşmak gerekebilir. Bu da, analizi yapan kişilerin, işin özünden çıkarak, analiz gerektirebilecek verilere değil, teknik olanaklara, daha kolay şekilde alabilecekleri verilere kanalize olmaları sonucunu doğurur. Bu nedenle, iş zekası programlarının pratik olmasının yanında, fazla teknik bilgi kullanmadan raporların alınabilir olması, farklı kaynakları bir arada kullanabilecek, konsolide edebilecek yapıda olmaları gerekir.
Boyutların başka bir özelliği de hiyerarşiler tanımlanabilmesidir. Hiyerarşiler sayesinde, hem toplamlara ulaşmak kolaylaşmakta, hem de farklı gruplar için, farklı senaryolar hazırlayabilme şansı doğmaktadır.
Karmaşık Hesaplamalar:
Bir OLAP sisteminin gerçek performansı, karmaşık hesaplamaları yapma gücü ile ölçülebilir. OLAP sistemleri, sadece toplama işleminden başka işlemler de yapabilecek güçte olmalıdırlar. Gerçek hayat, her zaman daha karışıktır. Analiz yapanlar için, asıl rakamlardan çok, yüzde sel dağılımlar çok daha önemlidir. Birkaç yıllık satış içerisinde, binlerce ürün türü için günlük bazda satışları yüzdesel olarak analiz edip, sıraya dizebilmek bir RDBMS ile saatler sürecek bir raporun çalışmasını gerektirebilir. Oysa uygun bir OLAP sistem ile, bir günlük satışlar ve birkaç yıllık satış rakamı arasında bir fark olmamalıdır. Satış tahminlerinde, genellikle “moving average” ve “yüzde artış” gibi trend analizleri kullanılır. Finansal analizlerde, envanter hesaplarında ve portföy performans hesaplarında, zamana göre ürünlerin toplanma sırası, sonucu tamamen değiştirebilir. (yukarıdan aşağıya, ya da aşağıdan yukarıya, LIFO-FIFO) Kullanılacak OLAP yapısında, bu şekilde hesaplamalara da izin verir bir yapısının olması gerekir.
Zaman kavramları:
Zaman boyutu, neredeyse her analizin temel bileşenidir. Zaman, diğer boyutlardan farklı olarak, kendine has bir sıralama içersinde gider. Alfabetik (Ocak her zaman Şubat’tan önce gelmelidir) veya nümerik sıralamalardan (12/31, 01/01’den önce gelmelidir) her zaman farklıdır. Gerçek OLAP sistemleri, zamanın bu şekilde sıralanmasını sağlarlar.
OLAP’ın yararları
Analiz yapan kişiler, daha kendine yeterli, IT’den bağımsız hale gelebilmektedirler.
Düşük kapasiteli sistemlerde yaşanan, zaman sıkıntısı problemleri ortadan kalkmaktadır. Üretim sistemini rapor için hızlandıracak büyük yatırımlar yerine, çok daha düşük maliyetli bir rapor sistemi kurmak bir çözüm olabilir. Yeni dönemde çıkan, tümleşik OLAP yapılarında, ilişkisel veri tabanı ve OLAP iç içe bir yapıda olduklarından, üretim sistemeleri ya da veri ambarları üzerinde, toplamlar gerektiğinde, ilgili sorgulama OLAP küplerine yönlendirilerek, çok yüksek ölçüde performans getirisi sağlanabilmektedir.
Ayrıca bu yapılar sayesinde, OLAP sistemi için, hem yazılım hem de güncelleme anlamında, ikinci kez masraf yapmak zorluğu da ortadan kalkmaktadır.
Bu şekilde bir yatırımla, var olan IT sistemi de rahatlamakta, üretim sistemi üzerinde yer alan raporlar ortadan kalkmaktadır.
Farklı kaynaklardan alınan kaynaklar konsolide edilmekte ve veri güvenliği sağlanmaktadır.
Veriler toplamları alınmış şekilde bulunduklarından, toplam verilerin bulunması için gerekli raw-data, analistin makinesine aktarılması gerekmediğinden, network üzerinde büyük ölçüde bir trafik kazancı sağlanmaktadır.
Zaman kazancı, aynı zamanda kaynakların etkin kullanımı ve para kazancı anlamına da gelmektedir.
Emir Türkmen
Emir.turkmen@advantage.com.tr
(Yazar hakkında: İTÜ Matematik Mühendisliği mezunu olan Türkmen, MBA eğitimini İstanbul Bilgi Üniversitesinde tamamlamıştır. 6 yıldır çeşitli tanınmış firmalarda programlama, Veri Tabanları, Data Warehousing ve OLAP üzerine çalışan Emir Türkmen, şu anda Benkar-Advantage’da Veritabanı Pazarlama Departmanında, Veri Madenciliği konusunda çalışmaktadır)