İstatistik, veri analitiğin temellerini oluşturmaktadır.
Bu yazıda bunu biraz daha somutlaştırmak amacıyla pratik hayattan örnek
sunacağım.
İlk olarak bir alış-veriş sitesi veya mağazasını düşünelim.
Örneğin firma erkekler ile kadınlar arasında veya bekar ile evliler arasında
alış-veriş alışkanlıklarında farklılık olup olmadıklarını araştırmak istesin.
Araştırma sonucunda, elindekileri verileri bilgiye dönüştürmüş olacaktır. Araştırma
yapılacakken kullanılacak yöntemler istatistiğe dayanmaktadır. Örneğimizdeki
araştırma için kullanılabilecek bir çok algoritma vardır. Algoritmaları
kullanmadan önce verilerinizin böyle bir araştırmaya uygun olup olmadığını,
verileriniz ne kadar güvenebileceğinizi test etmek gerekir ki; bu testlerde
standart sapma, varyasyon, p değer gibi istatistiğe özel kavramlarla
karşılaşırsınız.
![]() |
analyticstraining.com |
İkinci örneğimiz yine alış-veriş sitesinden olsun. A ürününü
alanların beraberinde hangi ürünleri aldıklarını tespit etmek için de yine veri
analitiği çalışması yapmak gerekir. Çalışmayı yaptınız ve genellikle A ürünü
ile B ürününün birlikte sepette yer aldığını tespit ettiniz. İkisinin arasında
bir ilişki olduğunu görünüyor ama bu ilişki bir nedensellik mi? Yani B’yi
alanlar, A’yı aldıkları mı için mi alıyorlar? Bu durumlarda regresyon ve korelasyon analizleri
yapılmaktadır.
Analitik için sıklıkla kullanılan yöntemler için http://www.datasciencecentral.com/profiles/blogs/40-techniques-used-by-data-scientists
adresine bakabilirsiniz.
Bir sonraki yazımda, değişken nedir, verilerden değişken
nasıl elde edilir, veriler nasıl sınıflanır gibi konulardan bahsetmeyi
düşünüyorum.
Hiç yorum yok:
Yorum Gönder