Veri Madenciliği Nedir? Veri Madenciliği Nasıl Yapılır?

VERİ MADENCİLİĞİ KAVRAMI

Büyük miktardaki verilerin üzerinde analiz yaparak veriler arasında var olan ve gelecek olan (tehdit, zarar, yeni iş gücü vb.) tahmin edilmesine yardımcı olacak anlamlı ve yararlı ilişki bilgisayar yazılımları aracılığıyla verilerin aranma olayıdır.

VERİ MADENCİLİĞİNİ ETKİLEYEN DİSİPLİNLER

  • İSTATİSTİK: Verilerin analizi ve değerlendirme konusunda geçmişten günümüze kullanılan aktif bir disiplindir.
  • MAKİNE ÖĞRENİMİ: Bilgisayarların vb. donanımların bazı işlemlerden çıkarımlar yapması.
  • GÖRSELLEŞTİRME: Verilerin tablolar, grafikler gibi görseller yardımı ile sunulmasını sağlayan teknolojiler diyebiliriz.
  • VERİTABANI: Birbirleri ile ilişkili olan ve amaca uygun bir biçimde düzenlenmiş mantıksal ve fiziksel olarak tanımlanmış verilerden oluşur.
  • GÖRÜNTÜ TANIMA: Daha önceden tanımlanmış bir model olarak düşünülen çok boyutlu bir görüntünün veritabanındaki benzerlerini yada en benzerlerini arama amacına yönelik yazılımlar diyebiliriz.

VERİ TABANLARINDA BİLGİ KEŞİF SÜRECİ

  • Amacın Tanımlanması: İşletmenin ya da kurumun veri madenciliği hangi amaca yönelik gerçekleştirmek istediğini belirlediği süreçtir.
  • Veriler Üzerinde Ön İşlemlerin Yapılması: Verilerin toplanması ve işlenmesi, kayıp verilerin geri nasıl getirebiliriz sorusuna cevabı, verideki gereksiz fazlalıkların temizlenmesi, verilerin normalizasyonu ve son olarak verilerin dönüştürülmesi işlemi gerçekleştirilir.
  • Modelin Kurulması ve Değerlendirilmesi: Veri madenciliği modelinin kurulduğu ve geçerli bir model olup olmadığının değerlendirildiği süreçtir.
  • Modelin Kullanılması ve Yorumlanması: Kurulan ve kullanılabilirliği test edilerek uygulamak üzere kabul edilen modelin kullanıldığı ve sonuçların yorumlandığı aşamadır.
  • Modelin İzlenmesi: Sistemin ne kadar verimli olduğunun izlendiği ve gözlenen sonuçlarına göre gerekiyorsa değişiklik ve düzenlemelerin yapıldığı aşamadır.

Bilgi keşif süreci nasıl olur onu anladık peki kullanılacak modeller nelerdir? Şimdi ona dilimin döndüğünce anlatayım.

Veri madenciliğinde kullanılan modeller 2 ayrı başlık altında toplanmıştır;

  1. TAHMİN EDİCİ MODELLER: Elde edilen verilerden yola çıkarak bir model geliştirilmesi ve geliştirilen model kullanılarak önceden sonuçları bilinmeyen veri kümeleri için sonuçların tahmin edilmesini hedefler.
  2. TANIMLAYICI MODELLER: Verilerdeki örüntü veya ilişkileri tanımlanır. Bu modeller tahmin edici tahmin edici modellerin aksine analiz edilen verilerin özelliklerini incelemek için kullanılan modellerdir. Tanımlayıcı modeller veritabanındaki kayıtlar arasında bir bağlantı, ilişki kurmaya çalışarak veritabanındaki kayıtlar arasında çok rastlanan kuralları ortaya çıkarır.

 

 

 

 

 

 

 

 

VERİ MADENCİLİĞİNİN UYGULANDIĞI ALANLAR;

  1. Pazarlama
  2. Finans
  3. Sağlık
  4. Endüstri ve Mühendislik
  5. Eğitim

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir