Hands-on pandas fundamentals project including indexing, aggregation, cleaning and EDA case studies.
Bu çalışma, aynı zamanda veri analizi sürecini sistematik ve analitik bir çerçevede ele almayı hedefleyen uygulamalı bir laboratuvar çalışmasıdır.
Temel hedefler:
- Veri ile düşünme pratiği geliştirmek
- Veri kalitesini sorgulama refleksi kazanmak
- Analitik yorumlama disiplinini oturtmak
- Portföy standardında, temiz ve açıklayıcı notebook yapısı oluşturmak
Bu bölümde pandas’ın temel yapı taşları ele alınmıştır:
.locve.ilocile veri seçimi- Boolean filtreleme
- Koşullu veri çıkarımı
- Sütun ve satır bazlı operasyonlar
.describe()ile betimsel istatistik analizi
Bu aşamada yalnızca teknik seçim yapılmamış;
.describe() çıktısı üzerinden:
- Eksik veri tespiti
- Değer aralığı analizi
- Çeyrek dağılım yorumlama
- Olası anomali kontrolü
gibi veri kalitesi farkındalığı geliştirilmiştir.
Bu notebook, veri analizi sürecinin en kritik kısmına odaklanır:
Veri temizliği ve toplulaştırma.
Uygulanan başlıca kavramlar:
- Eksik veri analizi
groupby()veagg()kullanımı- Değişken bazlı karşılaştırmalar
- Sabit (varyasyonsuz) kolon tespiti
- Negatif değerlerin anlamlandırılması
Bu bölümde özellikle:
- Eksik değer sayılarının yorumlanması
- Negatif finansal değerlerin olası anlamları
- Sabit kolonların (örneğin 365 gün gibi) modelleme açısından anlamsızlığı
- Yoğunlaşmış (clustered) dağılımların analizi
ele alınmıştır.
Amaç yalnızca kod yazmak değil,
veriyle sorgulayıcı ilişki kurmaktır.
Bu bölüm keşifsel veri analizine odaklanır:
- Histogram ile dağılım inceleme
- Boxplot ile grup karşılaştırması
- Görsel üzerinden hipotez üretme
- Temel yorumlama pratiği
Görselleştirme yalnızca grafik üretme değildir.
Her grafik sonrası:
- Dağılım yapısı
- Olası çarpıklık
- Grup farklılıkları
- İstatistiksel anlamlılık ihtiyacı
gibi sorular sorulmuştur.
Bu proje şu prensiplere göre hazırlanmıştır:
- Notebook’lar baştan sona çalıştırılmıştır.
- Debug hücreleri temizlenmiştir.
- Markdown açıklamaları ile öğretici yapı korunmuştur.
- Veri kalitesi analizi bilinçli şekilde entegre edilmiştir.
- Kod + yorum + bağlam birlikte sunulmuştur.
Amaç:
“Kod yazmak” değil,
“Analitik düşünceyi yapılandırmak”.
- Python 3.x
- pandas 2.x
- matplotlib
- seaborn
- Jupyter Notebook (Lab)
Bu çalışma, veri bilimi yolculuğunda sağlam bir temel oluşturma motivasyonu ile hazırlanmıştır.
Temel pandas becerilerini:
- bilinçli,
- sistematik,
- analitik,
- portföy standardında
bir yapıya dönüştürmek hedeflenmiştir.