Veri Madenciliği Nedir?

22.08.2017
• Teknoloji • Nedir • Nasil-Yapilir • Bilgisayar
Veri Madenciliği Nedir?

Veri Madenciliği Nedir?

Veri madenciliği, tüm veri işleme süreçleri (veri toplama, hazırlama, veri analizi ve uygulaması) ile mevcut veriler üzerinden geleceğe yönelik tahminler yapma ya da gizli kalıpları/ ilişkileri/ bağlantıları keşfetmeye yönelik modelleme tekniklerini içeren bir kavramdır. Gartner Group veri madenciliğini; “büyük verileri üzerinden mantıksal, istatistiksel ve matematiksel teknikleri kullanarak anlamlı yeni bağıntılar, kalıplar ve eğilimler keşfetme süreci" olarak tanımıştır.

Veri Madenciliği Araçları

Veri madenciliğinde, büyük hacimli verileri test etmek ve belirli bir popülasyondaki gizli kalıpları tanımlamak için yazılım kullanmayı gerektirebilir. Birkaç bin kayıtla örnekleme yapmak gibi basit görevler için MS Excel fazlasıyla yeterlidir. Ancak, büyük veri setlerini içeren bir veri madenciliği işi, tam ölçekli bir proje halinde ele alınmalıdır. Bu tür bir durumda, ETL ile veri ambarları gibi sunucu tabanlı araçlara ihtiyaç duyulabilecektir.

Veri madenciliği için teknik gereksinimler şu şekilde özetlenebilir:
*Exploratory data analysis “Keşifsel veri analizi“ (EDA) araçları, iş uzmanları tarafından verileri keşfetmek için kullanılır. Görsel analizden çok faydalanırlar. *Extract-Transform-Load "çıkart-dönüştür-yükle" (ETL) aracı, veri madenciliği için kullanılabilecek verilere biçimlendirmektir. ETL araçları, veri ambarı ürünlerinin standart bir bileşenidir.
*Verileri saklamak için veri tabanı (veri ambarı) kullanmk gerekir.
*Etkileşimli veri analizi araçları, iş uzmanları tarafından kullanılan ve analizi yaparak sonuçları rapor etmeye yarar.



Veri Madenciliği Süreci

Başarılı bir veri madenciliği yaklaşımı, veri madenciliğini bir iş süreci olarak uygulamayı gerektirir. Net şekilde tanımlanmış iş hedeflerine ve kapsamlı iş analizlerine ihtiyaç duyulurken; bu süreçler iş süreçlerinden kişiler tarafından gerçekleştirilmelidir. Veri madenciliği aşamaları şu şekildedir:
1.Soruları (iş ihtiyaçları) formüle edin.
2.Analiz yöntemlerini seçiniz.
3.Yöntemleri uygulamak için verileri hazırlayın.
4.Belirlenen model ve metotları, hedef verilere uygulayın.
5.Elde edilen sonuçları yorumlayın ve değerlendirin.

İlk ve son adım iş tarafı, aradaki süreçler ise teknik personelin aktif katılımını gerektirecektir.

Veri Madenciliği Metodolojisi

"Tam ölçekli veri madenciliği" projeleri iyi organizasyon gerektirir. En iyi bilinen veri madenciliği metodolojisi, Daimler-Chrysler ve SPSS tarafından geliştirilen, Veri madenciliği için çapraz-endüstri standart işlem (CRISP-DM) 'dir. Bu metodolojiye göre veri madenciliği aşamaları ve görevleri şunlardır: İş gereksinimlerinin belirlenmesi, verinin anlaşılması, veri hazırlığı, modelleme, değerlendirme, dağıtım, veri madenciliği ve büyük veriler.

Büyük Veri Ve Veri Madenciliği İlişkisi

Veri madenciliği ve büyük veriler birbiriyle ilişkili terimlerdir. Verilerin hacmi, çeşitliliği, değerini ve hızının arttığı ve büyük verilerin her alanda karşımıza çıktığı günümüzde veri madenciliği, işletmelerin büyük verilerini en etkili şekilde kullanabilmelerinin ayrılmaz bir parçası haline gelir.