2 Mart 2010 Salı

23 Şubat 2010 Salı

DO DÖNGÜSÜ (DO-Loop)

Bazı durumlarda tekrarlı hesaplamalar gerekmektedir. Tekrar hesaplamak için formülleri yeniden yazmak yerine döngü oluşturularak formül kalabalıklığından kurtulunur. Do döngüsü verilen sayı kadar aradaki işlemleri tekrar eder. Burada indeks, döngü saydırma amacıyla kullanılacak değişkenin adını ifade eder. Döngü “başlangıç” değerinden “bitiş “değerine kadar “adım” olasılıkları ile tekrarlanır.

Döngü içerisinde tekrarlanacak işlemlerin sonuna mutlaka END; gelmelidir. Genel yazılımı aşağıdaki gibidir.

DO indeks = başlangıç TO bitiş by adım;

SAS ifadeleri

END;

Örneğin, 1 den 100 e kadar 2 şer atlatmak istiyorsak;

DO I=1 TO 100 by 2; şeklinde yazarız.

Sadece birer birer artırılmak isteniyorsa

DO I=1 TO 100; şeklide yazmak yeterlidir.

Örnek :

Ortalaması 10 ve standart sapması 2 olan normal dağılıştan 100 şans sayısı üretelim.

DATA ssayisi;
DO I = 1 TO 100; // Döngümüz
Z = RANNOR(0); // Rasgele sayı üretme
X=Z*2 + 10;
OUTPUT;
END;

PROC PRINT; PROC MEANS; VAR Z X; RUN;


Burada normal dağılış gösteren 100 şans sayısı X değişkenine atanmıştır. Sonra standart normal değerleri ile birlikte tanımlayıcı istatistikleri istenmiştir. RANNOR (0) fonksiyonunda çekirdek değer ( başlangıç değeri, seed ) yerinde sıfır kullanılması ilk kullanılacak verinin, bilgisayarın saatinden alınacağını tanımlamaktadır.

SAS | Dağılımlar - Normal Dağılım

Aşağıda sık kullanılan olasılık dağılışları ve karşılık gelen SAS fonksiyonları listelenmiştir:

Normal dağılış PROBNORM (x)
Ki-kare dağılışı PROBCHI(x,df)
t- dağılışı PROBT(x,df)

Beta dağılışı PROBBETA(x,a,b)
Poisson dağılışı POISSON (lamda, n)

Ters normal dağ. PROBIT(arg)
Binom dağılışı PROBBNML (p,n,m)


Aşağıda bazı olasılık dağılışları ile şans sayısı üreten SAS fonksiyonları verilmiştir:

Normal dağılış RANNOR (seed)
Üniform dağılış RANUNI(seed)
Poisson dağılışı RANPOI (seed, lamda)
Binom dağılışı RANBIN (seed, n,p)
Üstel dağılış RANEXP(seed)

Normal dağılış

Normal dağılış ile olasılıkların hesaplanması iki şekilde olabilir. Birincisi; Z standart normal değerine karşılık gelen olasılığın hesaplanması, ikincisi ise; verilen olasılık düzeyine karşılık gelen Z standart değerinin hesaplanmasıdır.
Aşağıdaki örnek her iki durumu açıklamak için hazırlanmıştır.

Örnek:

DATA Normal1;
INPUT Z @@;
PROB = PROBNORM (Z);
CARDS;
-3 -2 -1 0 1 2 3

PROC PRINT;
RUN;

Bu uygulamada normal olasılık yoğunluk fonksiyonu yazılım şekli üzerinde durulmuştur.

Obs Z PROB
1 -3 0.00135
2 -2 0.02275
3 -1 0.15866
4 0 0.50000
5 1 0.84134
6 2 0.97725
7 3 0.99865

Bu uygulamada -3’ten +3’e kadar olan standart Z değerleri için olasılıklar hesaplanmıştır. Burada verilen olasılıklar ilgili Z değerine eşit ya da küçük olma olasılıklarıdır. Z dağılışı, ortalaması sıfır ve varyansı 1 olan standart normal dağılıştır. Olasılıklardan Z değerlerini hesaplayabilmek için ters (Invers ) olasılık fonksiyonu PROBIT kullanılır.


Örnek:

Normal1 örneğini tersten hesaplayalım. Yani, olasılıklar verilsin Z değerleri istensin.

Yukarıda bulunan P değerlerini kullanarak Z değerleri aşağıdaki program makrosu ile hesaplanabilir.

DATA Normal2;
INPUT P;
Z = PROBIT(P);
CARDS;
0.00135
0.02275
0.15866
0.50000
0.84134
0.97725
0.99865


PROC PRINT;
RUN;

Bu örnekte olasılıklardan Z değerini hesaplamak için PROBIT ters olasılık yoğunluk fonksiyonu kullanılmıştır. Sonuçlar aşağıdaki gibidir.

Obs P Z
1 0.00135 -2.99998
2 0.02275 -2.00000
3 0.15866 -0.99998
4 0.50000 -0.00000
5 0.84134 0.99998
6 0.97725 2.00000
7 0.99865 2.99998

Sonuçlar incelendiğinde Z değerleri tamsayı haline dönüştürülürse, normal1 örneğinde verilen Z değerlerinin hesaplandığı görülmektedir. Bu Z değerlerine eşit ya da küçük olma olasılıkları karşısında bulanan P değerleridir.



21 Şubat 2010 Pazar

Röportaj - Nuray Akmeriç ile Veri Madenciliği


Veri madenciliği nedir? Biz de bilmiyorduk. İşin uzmanı olan SAS Türkiye Ülke Müdürü Nuray Akmeriç´e sorduk.

Kurumlara çalıştıkları alanlarda daha verimli olmaları için gerekli olan yazılım alt yapısını sağlıyorsunuz. Bu yazılım alt yapısını her kuruma göre yeniden optimize etme süreciniz nasıl işliyor?

SAS kurumların ihtiyaçlarına yönelik, uçtan uca çözümler sunan bir firma. Hatta Dünya’da uçtan uca çözümler sunan tek firma diyebiliriz. SAS çözümleri aynı zamanda tüm platformlar üzerinde çalışabilme özelliğine sahip. Yani kurumun alt yapısı ne olursa olsun, bu alt yapıya uyum sağlayabiliyor. SAS’ın bir diğer özelliği ise, kullanıcılarına paket programlar satmaması. Tabi ki şirketlerin ihtiyaçlarına yönelik olarak sunduğumuz paket programlarımız var fakat bu programlar modüler bir yapıya sahip.

SAS bir müşteri ile çalışmaya başlamadan önce müşteriyi incelemeye alıyor, ihtiyaçları tam olarak nedir, bu ihtiyaçları karşılamaya yönelik olarak bugüne kadar neler yapmış, mevcut çalışmalarının ne kadarı bundan sonrası için de kullanılabilir durumda, kurumun nelere ihtiyacı var gibi bir takım ön çalışmalar yapıyor. Daha sonra kurumun ihtiyacı olan çözümü biraz önce bahsettiğim modüler yapısı sayesinde oluşturarak uygulamaya başlıyor. SAS’ın işi çözümü kurup kullanıcılara uygulamayı anlatmasıyla da bitmiyor, tüm süreç boyunca şirketin her türlü ihtiyacı için danışmanlık hizmeti de veriyor.

Veri madenciliği gibi bir terimi ilk defa sizden duyuyoruz. Nedir bu veri madenciliği?

Dünya’yı değiştirecek teknoloji olarak değerlendirilen Veri Madenciliği, önceden bilinmeyen ilişkileri ortaya çıkarmak için büyük veri yığınlarını kullanarak yapılan veri seçimi, incelemesi ve modelleme süreci olarak tanımlanıyor. Veri Madenciliği ile işletmeler, daha iyi karar almalarına ya da yeni iş fırsatlarını daha iyi tahmin etmelerine yardımcı olacak ‘önceden tahmine dayalı modeller’ oluşturabiliyorlar. Sade bir anlatımla veri madenciliği, kullanıcıların, büyük veri yığınları arasında istedikleri veriye ulaşması, bu veriyi ayrıntılı şekilde inceleyip iş kararlarına yönelik olarak kullanabilmesi anlamına geliyor.

Veri madenciliğine yönelik olarak SAS, müşterilerinin yeni veriler içerisindeki bilgileri daha hızlı ve kolay bir şekilde görüp, en iyi sonuçları alabilecekleri analizleri gerçekleştirebilmelerini sağlayan entegre analitik yazılım çözümleri sunuyor.

“SAS Enterprise Miner” Çözümü, çalışma grupları için gerekli esnekliği sağlayan basit ve entegre bir çözüm ile gerekli tüm çalışmaları destekleyerek, veriye ulaşımdan model geliştirmeye kadar tüm Veri Madenciliği uygulamalarını etkin hale getiriyor.

Dağıtımlı istemci/sunucu sistemi olarak geliştirilen çözüm, özellikle büyük şirketlerdeki Veri Madenciliği çalışmaları için kullanılıyor. “SAS Enterprise Miner” Çözümü, kritik iş ve araştırma konularını düzenlerken zorlayıcı değişimlerle karşı karşıya kalan veri madencileri, pazarlama analistleri, veri tabanı pazarlamacıları, risk analistleri, suistimal denetimcileri, mühendisler ve bilim adamları için tasarlandı.

Çalıştığınız alanın dünyadaki büyüklüğü nedir? Sizin bu pazardaki yeriniz nerededir? Aynı şekilde ülkemizde nasıl konumlanıyorsunuz?

1976 yılında kurulan, dünyanın en büyük bağımsız özel yazılım şirketi olan SAS Institute, Kurumsal Zekâ yazılımları ve hizmetleri konusunda uçtan uca çözüm sunan tek yazılım firması özelliğine sahiptir. 112 ülkede faaliyet gösteren SAS, aralarında 2006 Fortune Global 500 Listesi’nin ilk 100’ünü oluşturan kuruluşların %96’sının da bulunduğu birçok kurum ile çalışıyor. 1997 yılı sonunda açılan SAS Türkiye ofisi ise bugün orta ve büyük ölçekli 46 ulusal ve uluslararası kuruluşa hizmet veriyor.

American Bank ve IDC Financial’ın Kasım 2006’da yayınladığı “Finans Sektörüne Hizmet Veren Şirketler Araştırması”nda SAS, finans sektörüne çözüm sunan BT Şirketleri arasında dünyanın 20. büyük şirketi olarak yer alıyor. Söz konusu listede İş Zekâsı alanında en yakın rakibimiz 43. sırada, risk alanında son dönemde Türkiye’de sıkça karşılaştığımız rakibimizi ise 74. sırada görüyoruz. Yine ülkemizde Analitik CRM alanında rakiplerimizden olan firma ise bu sıralamada yer almıyor.

Dünya’nın ve Türkiye’nin en büyük ve başarılı finans kuruluşları, müşterilerini tanımanın verdiği gücü kazanmak, risklerini yönetmek konusunda yeni nesil İş Zekâsı yazılımları ve çözümleri ile pazar lideri olan SAS Institute'a güveniyor. Müşteri odaklı araştırma ve geliştirme çalışmalarına verdiği önemle, stratejik ortaklar ve diğer teknoloji sağlayıcılarla oluşturduğu yakın işbirliği sayesinde SAS Institute müşterilerine, SAS yazılımlarına yaptıkları yatırımlardan en üst düzeyde getiri elde edecekleri güvencesini veriyor.

Basel II ile ilgili olarak ne gibi çözümleriniz var?

Geleceğin bankacılık sistemini değiştirecek olan Basel II standartları bu yıl sonunda Avrupa’da uygulamaya konuyor, 2008 yılında da Türkiye’de bankalar tarafından uygulanmaya başlanması bekleniyordu fakat bu süreç BDDK tarafından 2009 yılına çekildi.

Basel-II bankalarda etkin risk yönetimini ve piyasa disiplinini geliştirmek, sermaye yeterliliği ölçümlerinin etkinliğini artırmak ve bu sayede sağlam ve etkin bir bankacılık sistemi oluşturmak, finansal istikrara katkıda bulunmak için sunulmuş önemli bir fırsat aslında. Avrupa’daki bankalar ve sermaye kuruluşlarının yoğun bir şekilde hazırlandığı, üzerinde çokça konuşulan ve sadece bankacılık sistemini etkileyeceği düşünülen Basel II tüm ticaret yaşamını değiştirecek bir standartlar bütünü. Bankaların sermaye yeterliliği standartlarını yeniden belirleyen ve risk yönetimini ön plana çıkaran Basel II düzenlemesi ile birlikte bankaların davranışını etkileyecek olan yeni risk yönetimi anlayışı kredi müşterilerine de yansıyacak.

Ülkemizde 2009 yılından itibaren uygulanmaya başlanacak Basel II ile birlikte, çeşitli kurum ve kuruluşlara sunulan kredinin sübjektif yöntemlerle “iyi” veya “kötü” kredi olarak belirlenmesi sürecinden, kredinin çeşitli unsurları ile “çok riskli” veya “az riskli” olduğunun belirlenmesi sürecine girilecek, fiyatlamanın buna göre yapılması kaçınılmaz olacak. Bu risk odaklı kredi fiyatlaması işletmelerin kullanacakları kredilerin miktarlarını, fiyatlarını olumlu veya olumsuz yönde etkileyebilecektir. Kullandırılan kredinin türünden vadesine, teminatından firma kredi notuna kadar çeşitli kriterler firmaların kullanacakları kredilerin fiyatına yansıyacak.

Kredi verilen firmanın derecelendirme notu düştükçe, banka hem daha çok risk alacak, hem karşılık olarak daha çok sermaye tutacak ve dolayısıyla daha çok kaynağını getiriden mahrum bırakacaktır. Bu durumda firmalara kullandırılacak kredilerin maliyetleri artacak.

Türkiye’deki KOBİ’lerin ülkemiz ticaretinin yüzde 99’unu oluşturduğunu göz önünde bulundurduğumuzda BASEL II’nin en büyük etkisi ise KOBİ ve Bankacılık sistemi ilişkisine dayanacak. KOBİ’lerimizin zaman zaman farklı merciler için farklı mali raporlar (bilanço, gelir-gider tabloları vb) üretmeleri söz konusu. KOBİ bilançolarının kredilendirmeye uygun olmaması (negatif sermaye, bilançodaki zarar), kayıt dışı işlemlerin bulunması, KOBİ’lerin derecelendirme aşamasında yaşayacağı zorlukların başında geliyor.

Bağımsız pazar araştırma kuruluşu Forrester Research'ün yayınladığı "Basel II: Kaotik Uygulamaları Fırsata Çevirmek" başlıklı raporda halen bankacılık sisteminde kullanılan uygulamaların sorunlarının başında; parçalanmış ve Odaklanamamış Yazılım Çözümleri ve mevcut Bilgi Teknolojileri altyapılarında kullanılan uygulamaların birbirleriyle entegrasyon sorunları olduğuna dikkat çekiliyor. Basel II standartlarının gerektirdikleri ise Kredi, piyasa ve operasyonel risk yönetiminin bir arada gerçekleştiren eksiksiz risk yönetimi özellikleri, kullanılan bankacılık uygulamalarından düzenli ve geçerli veri almayı sağlayan gelişmiş veri ambarı özellikleri ve risk yönetimine ilişkin verilere hızlı erişim sağlayan risk analizi raporlama becerileri.

Kredi riskleri analizi ile ilgili olarak Gartner G2 tarafından yayınlanan en son araştırma raporunda yapılan değerlendirmeye göre şirketler, çeşitli üreticiler tarafından geliştirilen nokta çözümler yerine, birbiriyle çalışacak şekilde tasarlanmış, entegre risk yönetimi bileşenlerine ve araçlarına gereksinim duyuyorlar. Bu sayede uzun dönemli iş ve teknoloji stratejilerinden ödün vermeden kısa dönemli risk yönetimi fonksiyonlarını yerine getirebiliyorlar.

Bu noktada, Basel II’ye geçiş sürecinde, finans kuruluşları, risk yönetimlerini daha etkin yapabilmek ve yönetebilmek adına ihtiyaçlarına en uygun teknolojik çözümü seçmeli, mevcut çözümler arasında iyi değerlendirme yapıp çözüm odaklı entegre bir hizmeti tercih etmelidir.

SAS olarak BASEL II’ye yönelik uçtan uca çözümlerimiz bulunuyor. Tüm dünyada önemli şirketler, BASEL II kurallarına uyum sağlamak adına SAS Kredi Risk Çözümleri’ni kullanıyor. SAS finans sektöründeki hizmetlerine, kara para aklama ile mücadeleye, risk yönetimini daha etkin şekilde idare etmeye ve yeni gelir kaynaklarını belirlemeye yarayan çözümleri ile devam ediyor. Basel II ile birlikte Kredi Skorlama’nın kurum içinde analitik uygulamalarla gerçekleştirilmesi zorunluluk olup, SAS Risk Yönetimi konusunda çözüm sunan firmalar arasında bunu gerçekleştirebilen tek firmadır.

(Bu röportajın bir kısmı 12 Ağustos 2007 tarihli Para dergisinde yayınlanmıştır.)

20 Şubat 2010 Cumartesi

SAS | Veri Tabanı Yönetimi

Öncelikle Microsoft Access 2007 ile basit bir veri tabanı nasıl oluşturulur kısaca buna değinip, daha sonrada oluşturduğumuz veri tabanı üzerinden Sas paket programı ile bir istatistiksel veri analizi gerçekleştirelim.Acces’te öncelikle boş bir veritabanı yaratıp bunu 2000 formatında yani *.mdb olacak şekilde oluşturuyoruz. Çalışmamda veritabanımın ismini veri.mdb olarak oluşturdum.




Sütunlara değişkenlerimizi girelim.

Yas, Cinsiyet, Gun_int_kul ( Günlük internet kullanımı )

Veri girişlerini buradan yada veritabanımıza bir form ekleyerek daha kolay bir şekilde yapabiliriz. (Tercihe bağlı )

Veri girişimizi yaptıktan sonra tabloyu kapatıyoruz; ben tablo ismi olarak “durum” tercih ettim.Oluşturduğumuz tablo üzerinde sağ tıklayıp tasarım görünümüne geçiyoruz.


Değişken tiplerini tasarım görünümünden ayarlıyoruz. Bu şekilde veri tabanımızı oluşturma tamamlanmış oluyor… Artık Access’i kapatıp SAS paket programını açabiliriz.

Sas paket programında aşağıda yazmış olduğum kodları editör kısmına yazıyoruz.

PROC IMPORT OUT= WORK.veri
DATATABLE= "durum" // veri tabanı tablo ismi
DBMS=ACCESS REPLACE;
DATABASE="C:\veri\veri.mdb"; // veri tabanı yolu
RUN;

Yukarıdaki kodlar yardımıyla veri tabanımızı SAS’a tanıttık.
Şimdi veri tabanımız üzerinden ki-kare analizi gerçekleştirelim. ( Cinsiyet ile günlük internet kullanımı arasında fark var mı? )
Yukarıdaki kodları silmeden bir alt satıra geçerek editöre şu kodları ekleyin.

proc freq ;
tables cinsiyet * gun_int_kul / chisq expected;
run;


SAS ÇIKTISI :

The FREQ Procedure

Statistics for Table of Cinsiyet by gun_int_kul

Statistic DF Value Prob
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Chi-Square 6 8.0000 0.2381
Likelihood Ratio Chi-Square 6 10.5850 0.1021
Mantel-Haenszel Chi-Square 1 2.1411 0.1434
Phi Coefficient 1.0000
Contingency Coefficient 0.7071
Cramer's V 1.0000

WARNING: 100% of the cells have expected counts less
than 5. Chi-Square may not be a valid test.
Sample Size = 8




19 Şubat 2010 Cuma

SAS Programlama Genel Yapısı

Sas ile yapılan programlar iki başlık halinde oluşturulur.

- Toplanan verinin yazıldığı data basamağı
- Bu verilerin analizinin gerçekleştirildiği proc ( prosedür ) basamağıdır.

Data Basamağının Genel Formu

Data veri setinin ismi;
İnput değişkenler;
Cards;
Veriler
;
Run;


Proc Basamağı

Örneğin Proc Print ifadesinin genel formu

Proc print data = veri setinin ismi;
By değişken isimleri;
Var değişken isimleri;
Run; // Proc print ifadesi bütün değişkenlerin okunduğu gibi yazdırılmasında kullanılır.

Diğer örnek prosedürler; Proc Sort, Proc Univariate, Proc Means, Proc Freq, Proc Chart, Proc Catmod…

16 Şubat 2010 Salı

Sas Temel Bilgiler

Sas kelimesi , Statistical Analysis System kelimelerinin baş harflerinin birleşmesiyle oluşmuştur. SAS'ı Türkiye'de ilk olarak 1987 yılında Hava Kuvvetleri Komutanlığı kullanmıştır. Daha sonrada Die ve Hacettepe Üniversitesi yararlanmıştır. Günümüzde ise Türkiye’nin önde gelen kurumsal firmaları SAS paket programını tercih etmektedir. Bunun nedeni Sas paket programının kullanıcılara sunduğu modüllerinin bir hayli fazla olması ve kullanışlı olmasıdır. Bir nevi Sas modüller birleşimidir. Bazı SAS modüllerini ve açıklamalarını aşağıda bulabilirsiniz

SAS / STAT : Bazı istatistiksel analizlerin yanında, Regresyon, Anova, Faktör Analizi ve Loglineer Analiz gibi birçok karmaşık istatistiksel prosedürleri gerçekleştirir. ( İstatistik )

SAS / GRAPH : Çubuk, pasta ve blok şeklindeki grafikleri, iki ve üç boyutlu grafikleri ve haritaları içerir.

SAS / QC ( Quality Control ) : Süreç yetenek analizi, istatistiksel süreç kontrolü deney tasarımı ve örnekleme planı için araçlar içerir.

SAS / OR ( Operations Research ) : Yöneylem araştırmasında üretim sistemleri geliştirilmesinde, proje tamamlama problemleri çözümünde kullanılan programları içerir.

Kaynaklar
Özaydın, 2001

Sas | Başarı Öyküleri

SAS TÜRKİYE MÜŞTERİ PORTFÖYÜ

Araştırma
• Nielsen Araştırma Hizmetleri A.Ş.

Kamu
• K.K.T.C. Başbakanlık Devlet Planlama Örgütü
• T.C. Başbakanlık Gümrük Müsteşarlığı
• T.C. Başbakanlık Türkiye İstatistik Kurumu

Perakende
• Boyner Büyük Mağazacılık A.Ş.
Sigorta
• Aviva Sigorta A.Ş.
• AXA Sigorta A.Ş.
• Başak Groupama Emeklilik A.Ş.
• Başak Groupama Sigorta A.Ş
• Ergoİsviçre Sigorta A.Ş.
• Eureko Sigorta A.Ş.
• Fiba Sigorta A.Ş.
• Generali Sigorta A.Ş.
• Koç Allianz Sigorta A.Ş.
• Koç Allianz (Sağlık) Sigorta A.Ş.
• Ray Sigorta A.Ş.

Bankacılık
• Akbank T.A.Ş.
• Citibank A.Ş.
• Garanti Bankası A.Ş.
• HSBC Bank A.Ş.
• Türk Ekonomi Bankası A.Ş.
• Türkiye Halk Bankası A.Ş.
• Türkiye İş Bankası A.Ş.
• Türkiye Sınai Kalkınma Bankası A.Ş.
• Yapı ve Kredi Bankası A.Ş.

Lojistik
• Arıkanlı Holding A.Ş.

Telekomünikasyon
• Avea İletişim Hizmetleri A.Ş.
• Turkcell İletişim Hizmetleri A.Ş.
• Vodafone Telekomünikasyon A.Ş.

Danışmanlık
• Experian Ltd.
• Pharos Strateji Danışmanlık Ltd. Şti.
• Pricewaterhouse Coopers

Medya
• Digital Platform İletişim Hizmetleri A.Ş.

Ulaştırma
• Türk Hava Yolları A.O.

SAS TURKEY

Yapım Aşamasında

Çok Yakın Zamanda İstatistik Paket Programları ile veri analizleri, makale özetleri, istatistik alanında yapılmış röportajlar, kariyer yolcululukları hakkında yazılar sayfamda yer alacaktır... İlginiz için teşekkürler.