Makine öğrenmesi algoritmaları ile öngörüsel müşteri kaybı tahmini ve analizi(Churn Prediction) Giriş-1

Arda Batuhan Demir
4 min readJun 27, 2019

--

Selamlar Herkese,

Öncelikle kendimi tanıtarak başlamak istiyorum,

Ben Arda Batuhan Demir, Doğuş Üniversitesi Bilgisayar Mühendisliği 2019 Mezunuyum ve Deep Learning Türkiye’deki meduim.com aracılığı ile ilk yazımı sizlerle paylaşmak ve bitirme projemizdeki kullandığım teknolojiler ve deneyimlemeye çalıştığım bilgileri sizlerle buluşturmak istiyorum…

Veri Madenciliği ve Veri Analizi’ne Giriş

Aslına bakarsanız, ilk yazım bir giriş yazısından ibaret olacak bu yazımda veri madenciliği ve makine öğrenmesi ile alakalı kullanım alanlarını ve elde edeceğimiz ‘ön-görüsel müşteri kaybı’ analizini(Churn Prediction) ile ilgili bir bilgilendirme yazısı olacak…İlerleyen yazılarda ise uygulamalı ve örnekleriyle beraber hem algoritmaları hem de kullanılan tekniklerle ilgili bir yazı serisi paylaşıyor olacağım…

Bugünlerde hepimizin adını sıklıkla duyduğumuz ve sektörde pasta diliminin en büyük paylarından birine sahip olan “Veri Madenciliği & Veri Analizi” konusu hem ülkemizde hem de dünyada büyük bir önemli konu haline gelmiştir.

Veri Madenciliği gittikçe artan büyük veri kayıplarının ve bunun yanı sıra işletmelerde yaşanan ‘Müşteri Kayıp’larının artması ile birlikte, hem ülkemizde hem dünyada dönüştürülebilir ve anlamlandırılabilir bilginin toplanabilmesi ve verilerin ayrıştırılarak etkin ve yararlı hale getirildiği sistematik bir işleme dönüşüm aşamalarının bir bütünüdür.

Hali hazırda kullanılan sistemlerin ürettiği çıktıların(yani verilerin) tek başına, çıplak bir göz ile değerlendirilebilmesi mümkün olmadığından(mümkün olmasından ziyade, belli bir amaç doğrultusunda değerlendirilmeye alınmalıdır…),sistematik bir amaca yönelik hazırlanan ve işlenen bilginin(knowledge) anlam kazanmaya başladığı bir konudan bahsedeceğiz …

Veri madenciliği & veri analizi’nin yanı sıra büyük veri diye anlamlandırdığımız ve ilişkisel veya ilişkisel olmayan veritabanları(veri setleri de olabilir, kullanım amacına ve veri yoğunluğuna göre değişebilir..) üzerinden, geçmişe dair bilgilerin keşfedilebilmesi ve ileriye dair ‘öngörüsel’(prediction) bir tedbir alabilmemizi sağlayacak ve olası kayıpların önüne bir parça daha geçebilmek adına örüntü ve eğilimleri keşfetme işlemidir.

Ham veriyi yani bilgiyi anlamlı hale dönüştürme günümüzde veri madenciliği kapsamında küçük veya büyük diye bir ayırım yapılmadan her işletmenin en önemli konularından birisi haline gelmiştir.

Veri Madenciliği, uygulama alanları esas alındığında; tıp ,borsa, bankacılık, sigortacılık, telekominikasyon, mühendislik ve endüstri gibi sayılı ve önemi gittikçe artan diğer tüm sayısız dallarda uygulama alanı olarak ilerleyen teknolojiyle birlikte tam merkezi ve kalbi haline gelmiştir.Veri madenciliği, veri temizleme(data pre-preocessing),veri bütünleştirme, niteliksel veri seçme, veri madenciliği örüntü değerlendirme ve bilgi sunumu aşamalarını kapsayan bir yol haritasına sahiptir.

İlerleyen teknoloji ve yeni nesil servis mimarileri ile birlikte, birçok veri elektronik ortamda saklanabilmekte ve mikro servis-mimarileri kapsamında bulut teknolojiler esas alındığında veriye erişim oldukça kolaylaşmaktadır.Erişilen bilgiler veri madenciliği algoritmaları ile otomatik olarak sınıflandırılabilmekte, mikro servis-mimarileri çerçevesinde bulut teknolojiler ile saklanıp kolaylıkla işlenebilmektedir.

Müşteri Kaybı Tahmini(Churn Prediction)

Bu bölümde bitirme projemizinde konusu olan Mobil Operatörlerdeki ‘Müşteri Kaybı Tahmini’ ile ilgili bir yazı paylaşmaya çalışacağım…Aslında ‘Ön-görüsel Müşteri Kaybı Tahmini’ demenin daha doğru olacağını düşünüyorum çünkü ; bir müşterinin operatör değiştirip/değiştirmediğinden ziyade neden operatör değiştirdiği veya neden operatör değiştirebileceği sorularının da Churn Prediction ile genişletilmiş bir alanda yer alabileceğini düşünüyorum..

Telekom şirketlerinin en büyük sorunlarından birisi olan Churn Prediction, tam türkçesi ile birlikte “Müşteri Kaybı Tahmini”, telekominikasyon şirketlerinin büyük verideki karşılaştığı en büyük sorunlardan birisidir.Dolayısıyla, müşteriyi elde tutma ve son kullanıcı deneyimini iyileştirebilmek adına telekom operatörlerinin karşı karşıya kaldığı en kritik zorluklardan birisi olarak nitelendirilen bir konu ele alınmıştır.

Öngörüsel müşteri kaybı analizleri ve bu alanda kullanılan sınıflandırma algoritmaları ile toplanan veriler kullanılarak müşterilerin hangi alanda neden operatör değiştirdikleri veya paket/tarife değişimi yaptıkları elde edilebilmektedir.Sözü geçen bu çalışmada, telekominikasyon şirketleri ayrılma ihtimali olan müşterilerini doğru bir şekilde tespit edebilmektedir.

Aslında konunun derinine inmek gerekirse, ‘Müşteri Kaybı Tahmini’nin ilk noktası “doğru kullanıcı”yı tespit etmek olmalıdır.İlk olarak telekom şirketlerinin uyguladığı paket/tarife ve fiyat/performans ölçütlerine göre asıl sorulması gereken soru şu olmalı : “Bizim gerçek müşterimiz kim ?”…

İkinci bir noktada, gerçek ve doğru müşteri tespitinden sonra yapacağımız bu ön fizibilite çalışmasını dallandırmak şu şekilde doğru olabilecektir: 1) Yeni müşterilerimiz kim ?…2) Müşteri ağımızda bulunan müşterilerimiz bizi neden terk ediyor ?..sorularına veri madenciliği ve veri analizi teknikleriyle cevap arayabilmek ve en yakın doğru oranı buluyor olabilmek bu kapsamda yapılabilecek en nitelikli çalışmalardan birisi olmalıdır.

Üçüncü bir noktada, bildiğiniz üzere gerçek bir dijital çağ yaşıyor ve yeni nesil bir çağa geçmiş bulunuyoruz…Hayatımızın her alanında, her dakikası ve her saniyesinde birebir internet çağı yaşıyoruz diyebiliriz.Bu bağlamda, telekom operatör şirketlerinin sunduğu avantajlı paketlerden ziyade, bu paketlerin içersindeki internet miktarı ve müşterilerin tükettiği internet oranı, operatör ve paket/tarife seçiminde zirvede yerini alabiliyor diyebiliriz.Operatör şirketlerinin stratejik olarak sunduğu avantajlı internet paketleri ve bunun yanı sıra sunduğu avantajlı fiyatlar operatör şirketleri arasındaki rekabeti arttıran çok önemli bir faktör olduğu kolaylıkla gözlemlenebilmektedir.

Tüm bu ana noktaları birleştirdiğimizde aslına bakarsanız, sırasıyla doğru kullanıcı, doğru internet paketi ve avantajlı fiyat baremleri göz önünde bulundurulursa, müşteri kaybı tahminin erken tespiti ve kategorilerine göre sınıflandırılabilmesi oldukça kolaylaşabilmektedir.

Bir sonraki yazımda; Google Forms aracılığı ile veri çekme ve Pandas DataFrame kütüphanesi ile de veri seti yaratıp, makine öğrenmesi ve sınıflandırma algoritmaları ile bu veri setini/veri setlerini kullanabiliyor ve uygulamalı olarak örneklendirebiliyor olacağız…

Arda Batuhan Demir

--

--

Arda Batuhan Demir
Arda Batuhan Demir

Written by Arda Batuhan Demir

5x AWS Cert* | Senior DevOps Engineer | Cloud Architect | AWS Community Builder

No responses yet