Blog

Veri Madenciliği (Data Mining) Nedir?

6.8.2020

Veri alanında çalışan akademisyen ve profesyonellerin yapmış oldukları tanımlamalara baktığımız zaman veri madenciliğinin ne olduğu konusunda bir fikir birliğinin olmadığını görürüz.

Ancak veri madenciliğini genel olarak anlatmak gerekirse; büyük miktarda verinin içerisinden anlamlı sonuçlar çıkartabilmek amacıyla otomatik ya da yarı otomatik yöntemlerle işlenmesi ve anlamlı verilere ulaşılması diyebiliriz.

Kullanım alanlarıysa piyasadaki hemen her alanda çeşitli şekillerde yapılmaktadır. Madencilik; her türlü elektronik ortama dayalı işte, pazarlamacılıkta, bankacılık ve sigortacılıkta artık temel bir disiplin haline gelmiştir. Örneğin pazarlama alanında kullanılan Veri Madenciliği sistemi, müşterilerin satın alma alışkanlıklarını tespit ederek bunlara yönelik stratejiler izlemektedir. Müşterilerin yaş, eğitim, cinsiyet ve lokasyon gibi temel özelliklerinin incelenmesiyle ortaya çıkan satış tahminleri ve pazar sepeti analizleri, sektöre oldukça fayda sağlamaktadır. Bu faydaya ulaşmak içinse şu yöntemler izlenmektedir.

  • Veri yığınını elde etme ve güvenliğini sağlama
  • Veri Temizleme (Smoothing)
  • Veri Bütünleştirme (Damy-Optimization)
  • Veri İndirgeme
  • Veri Dönüştürme (Normalization)
  • İlgili Veri Madenciliği Algoritmaları Uygulama (Kümeleme, Sınıflandırma, Karar Destek Ağaçları)
  • Sonuçları ilgili yazılım dillerinde test ve eğitim aşamasına sokma (R, Python, Java - Makine öğrenmesine giriş)
  • Sonuçların değerlendirilmesi ve sunulması

Yapılan araştırmalar, teknolojiye hakim olma düzeyinin artık veriyi doğru kullanma ve işleme becerisiyle orantılı olacağını ortaya koymuştur. Her birimiz ciddi anlamda veri paylaşıyoruz. Bu verilerin analizini yapacak, bunlardan anlamlı sonuçlar üretebilecek çok az sayıda insan kaynağımız var. Bu alanda eğitim imkanlarını artırarak çözümler aramalıyız. Çünkü Veri Analizi ve Veri Madenciliği çok daha uzunca bir süre yükselen bir trend olacaktır.

Kaynak

Kaynak 2