Veri Madenciliği Nedir?
Veri Madenciliği Nedir?
Veri madenciliği, tüm veri işleme süreçleri (veri toplama, hazırlama, veri analizi ve uygulaması) ile mevcut veriler üzerinden geleceğe yönelik tahminler yapma ya da gizli kalıpları/ ilişkileri/ bağlantıları keşfetmeye yönelik modelleme tekniklerini içeren bir kavramdır. Gartner Group veri madenciliğini; “büyük verileri üzerinden mantıksal, istatistiksel ve matematiksel teknikleri kullanarak anlamlı yeni bağıntılar, kalıplar ve eğilimler keşfetme süreci" olarak tanımıştır.Veri Madenciliği Araçları
Veri madenciliğinde, büyük hacimli verileri test etmek ve belirli bir popülasyondaki gizli kalıpları tanımlamak için yazılım kullanmayı gerektirebilir. Birkaç bin kayıtla örnekleme yapmak gibi basit görevler için MS Excel fazlasıyla yeterlidir. Ancak, büyük veri setlerini içeren bir veri madenciliği işi, tam ölçekli bir proje halinde ele alınmalıdır. Bu tür bir durumda, ETL ile veri ambarları gibi sunucu tabanlı araçlara ihtiyaç duyulabilecektir.Veri madenciliği için teknik gereksinimler şu şekilde özetlenebilir:
*Exploratory data analysis “Keşifsel veri analizi“ (EDA) araçları, iş uzmanları tarafından verileri keşfetmek için kullanılır. Görsel analizden çok faydalanırlar. *Extract-Transform-Load "çıkart-dönüştür-yükle" (ETL) aracı, veri madenciliği için kullanılabilecek verilere biçimlendirmektir. ETL araçları, veri ambarı ürünlerinin standart bir bileşenidir.
*Verileri saklamak için veri tabanı (veri ambarı) kullanmk gerekir.
*Etkileşimli veri analizi araçları, iş uzmanları tarafından kullanılan ve analizi yaparak sonuçları rapor etmeye yarar.
Veri Madenciliği Süreci
Başarılı bir veri madenciliği yaklaşımı, veri madenciliğini bir iş süreci olarak uygulamayı gerektirir. Net şekilde tanımlanmış iş hedeflerine ve kapsamlı iş analizlerine ihtiyaç duyulurken; bu süreçler iş süreçlerinden kişiler tarafından gerçekleştirilmelidir. Veri madenciliği aşamaları şu şekildedir:1.Soruları (iş ihtiyaçları) formüle edin.
2.Analiz yöntemlerini seçiniz.
3.Yöntemleri uygulamak için verileri hazırlayın.
4.Belirlenen model ve metotları, hedef verilere uygulayın.
5.Elde edilen sonuçları yorumlayın ve değerlendirin.
İlk ve son adım iş tarafı, aradaki süreçler ise teknik personelin aktif katılımını gerektirecektir.