Data Mining / Veri Madenciliği Nedir? Ne İşe Yarar?


Data Mining / Veri Madenciliği Nedir?

Mantık olarak, bir veri kümesinden bilgileri ayıklamak ve kullanım için anlaşılır bir yapı haline dönüştürmektir bu verileri anlamlı bir şekle dönüştürmek için ise istatistiksel bilgiye ve analitik düşünceye sahip olmak gerekir bu sebepten ötürü bu konuya meraklı olan kişilere ilk önerimiz istatistik konularında araştıma yapmaları gerekir.

Tanım olarak ise veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Bu da; kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir.
Başka bir deyişle, veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir.

Bunun güvenlik açısından önemi ise şöyledir ki, hackerlar sistemlere sızdıkları zaman ellerine geçirebildikleri tüm bilgileri kendi disklerine yedeklerler ve bu verileri bir takım illegal mecralarda satışa koyarlar.. Yada reklam servislerine satarlar..

Canlı örnek vermek gerekirse mesela bazen spam yani tanımadığınız bir numaradan reklam mesajı alırsınız.. Bu mesajlar size çok sık geliyor ise telefon numaranızı kaydettiğiniz site, sistem,kişilere dikkat etmelisiniz..  Veri madenciliği çok basit olarak işte burada işe yaramaktadır.

Mantığı şöyledir. Siz mesela diyelim ki cetinia'ya üye olurken veya buzdolabı alışverişi yapan bir siteye üye olurken numaranızı kaydettiniz. Yada sisteme üye olmak için telefon vermek şart diyelim. Bu veriler bir yerde depolanır ve hackerlarca çalınabilir yahut site sahibi, bu verileri mesela bulaşık makinası alışverişi yapan bir firmaya satabilir. Buzdolabı ve bulaşık makinası aynı kategoride değil mi? Yani kategori olarak ayırılır veriler ve ona göre değerlendirilir..

Teorik olarak devam edecek olursak;

BAĞINTI: “Çocuk bezi alan müşterilerin %30’u bira da satın alır.”
Sepet analizinde (basket analysis) müşterilerin beraber satın aldığı malların analizi yapılır. Buradaki amaç mallar arasındaki pozitif veya negatif korelasyonları bulmaktır. Çocuk bezi alan müşterilerin mama da satın alacağını veya içki satın alanların cips de alacağını tahmin edebiliriz ama ancak otomatik bir analiz bütün olasılıkları gözönüne alır ve kolay düşünülemeyecek, örneğin çocuk bezi ve içki arasındaki bağıntıları da bulur.

SINIFLANDIRMA: “Genç kadınlar küçük araba satın alır, yaşlı, zengin erkekler büyük, lüks araba satın alır.”
Amaç bir malın özellikleri ile müşteri özelliklerini eşlemektir. Böylece bir müşteri için ideal ürün veya bir ürün için ideal müşteri profili çıkarılabilir.

Örneğin bir otomobil satıcısı şirket geçmiş müşteri hareketlerinin analizi ile yukarıdaki gibi iki kural bulursa genç kadınların okuduğu bir dergiye reklam verirken küçük modelinin reklamını verir..





Hiç yorum yok:

Yorum Gönder

Yorum yaptığınız için teşekkürler..