📊 Veri Kalitesi Neden Önemli?
Müşteri veritabanında 10.000 kayıt var. Ama 2.000'inde telefon numarası yok. 500'ü dublike. 100'ü de hatalı format. Verilen analiz yanlış olur!
⚠️ Veri Kalitesi Sorunları
| Sorun | Tanımı | Örnek |
| Eksik Veri | Hücre boş | Telefon numarası yok |
| Yanlış Format | İstenmeyen formatta | Telefon: "0312 abc 1234" |
| Dublike | Aynı veri 2+ kez | Ahmet'in aynı recordu 2x |
| Anormal Değer | İstatistiksel outlier | Yaş: -5 veya 200 |
💡 Eksik Veri Tespiti
=EĞERSAYSA(SütunAralığı, "") (Türkçe: Kaç hücre boş?)
Örnek: Telefon sütununda 2000 boş hücre. Veri Tamamlanma Oranı: (10000-2000)/10000 = %80
🔍 Format Kontrol
=EĞERSAYSA(TelefonSütunu, "<>##########") (Türkçe: Telefon numarası 10 karakterden farklı olan kaç tane?)
Açıklama: Türkiye cep telefonu 10 hane (0 dahil). Başka uzunluktakiler yanlış format!
🔄 Dublike Tespiti
=EĞERSAYSA(MüşteriIDSütunu, MüşteriID) > 1 (Türkçe: Bu ID kaç kez geçiyor? 1'den fazlaysa dublike!)
📊 Veri Kalitesi Raporu
| Metrik | Sayı | % | Durum |
| Toplam Kayıt | 10.000 | 100% | - |
| Eksik Veri | 2.000 | 20% | 🔴 KRİTİK |
| Dublike | 500 | 5% | 🟡 UYARI |
| Yanlış Format | 200 | 2% | 🟡 UYARI |
| Temiz Veri | 7.300 | 73% | 🟡 Zayıf |
💯 Veri Kalitesi Skoru
=((TemizVeri / ToplamVeri) * 100) (Türkçe: Temiz veri yüzdesini hesapla)
Eğer skor %95+ ise veri yüksek kalitede. %80-95 arası orta. %80 altında kötü!
⚡ Otomatik Uyarı
=EĞER(EksikVeriYüzdesi>10, "🔴 VERİ KALİTESİ SORUNU - TEMİZLE", "✅ KABUL EDILEBILIR") (Türkçe: %10'dan fazla eksik veriyse, verileri temizle)
🎪 Challenge
Müşteri veritabanında 5000 kayıt var. Eksik veri, format hataları, dublikaları tespit et. Veri kalitesi raporunu oluştur ve temizleme planı yap!
Henüz yorum yapılmamış. İlk yorumu sen yap!
Yorum Yap