İçerikler
🗺️ Haritam
☕ Destek OlGiriş YapKayıt Ol
Ana sayfainteraktif

Merkezi Limit Teoremi: her şey eninde sonunda normal dağılır

2026 · istatistik · olasılık · 10 dakika

Dağılım ne kadar çarpık, garip veya simetrik olursa olsun — yeterince büyük bir örneklemden alınan ortalamaların dağılımı hep normal dağılıma yaklaşır. Bu, istatistiğin en güçlü ve en şaşırtıcı gerçeklerinden biri. Aşağıda gözlerinizle görün.

Nasıl çalışır?

Bir popülasyondan n tane değer seç, ortalamasını al. Bunu yüzlerce kez tekrarla. Bu ortalamaların dağılımı ne olur?

Örneklem ortalaması: X̄ = (X₁ + X₂ + ··· + Xₙ) / n
Ortalama: E[X̄] = μ    (popülasyon ortalamasına eşit)
Standart hata: SE = σ / √n    (n büyüdükçe küçülür)

Popülasyon dağılımı ne olursa olsun, n yeterince büyükse X̄ ~ N(μ, σ²/n) yakınsaması gerçekleşir. Genellikle n ≥ 30 yeterlidir.

⚡ Merkezi Limit Teoremi — DeneÖrnekle butonuna bas
POPÜLASYONun DAĞILIMI
Her değer eşit olasılıkla — tamamen düz
ÖRNEKLEM BÜYÜKLÜĞÜ (n) — her örnekte kaç değer?
Teorik standart hata: σ/√n = 0.289/√1 = 0.289
POPÜLASYONun DAĞILIMI (μ=0.50, σ=0.289)Düzgün
0.000.250.500.751.00
↓ n=1 değer seç → ortalama al
ÖRNEKLEM ORTALAMALARI DAĞILIMI (0 örneklem)
0.000.250.500.751.00
Örnekle butonuna bas →
💡 Dene: Bimodal dağılımı seç, n=1 ile başla → çarpık görünür. Sonra n=30 yap → birkaç yüz örneklemden sonra normal eğriyle örtüşür.

Neden bu kadar önemli?

İstatistiğin büyük çoğunluğu bu teoreme dayanır. Güven aralığı hesaplarken, hipotez testi yaparken, A/B testi sonuçlarını yorumlarken — hepinde örneklem ortalamasının normal dağıldığını varsayarsın. Popülasyon dağılımı ne olursa olsun bu varsayım geçerli çünkü CLT var.

Ne zaman dikkatli olmalısın?

  • Küçük örneklem (n < 30): CLT henüz tam oturmamış olabilir, özellikle çarpık dağılımlarda
  • Ağır kuyruklu dağılımlar: Çok aşırı değerler içeren dağılımlar için daha büyük n gerekebilir
  • Bağımlı gözlemler: Zaman serisi, kümelenmiş veri — bağımsızlık varsayımı bozulabilir

Günlük hayatta CLT

  • 100 müşterinin ortalama sipariş tutarı her gün biraz farklı — ama bu farkların dağılımı normaldir
  • A/B testinde conversion rate'lerin farkı — normal dağılıma yaklaşır, bu yüzden z-testi kullanabiliriz
  • Seçim anketleri — örneklem yeterince büyükse ±hata marjını güvenle hesaplarsın

Python'da

import numpy as np
import matplotlib.pyplot as plt

# Bimodal popülasyondan örnekle
def bimodal():
    return np.random.normal(0.25, 0.08) if np.random.random() < 0.5            else np.random.normal(0.75, 0.08)

n = 30          # örneklem büyüklüğü
tekrar = 1000   # kaç kez örnekle

ortalamalar = [
    np.mean([bimodal() for _ in range(n)])
    for _ in range(tekrar)
]

# Sonuç → normal dağılıma benzeyecek
plt.hist(ortalamalar, bins=40, density=True, color='#1D9E75', alpha=0.7)
plt.title(f'Örneklem ortalamaları — n={n}, tekrar={tekrar}')
plt.xlabel('x̄')
plt.show()

# Ampirik standart hata
print(f"Teorik SE: {0.271 / np.sqrt(n):.4f}")
print(f"Ampirik SE: {np.std(ortalamalar):.4f}")

Özet

  • Popülasyon dağılımı ne olursa olsun, örneklem ortalamaları normal dağılıma yaklaşır
  • n arttıkça yakınsama hızlanır, standart hata (σ/√n) küçülür
  • n ≥ 30 çoğu durumda yeterlidir
  • Güven aralığı, hipotez testi ve A/B testinin matematiksel temeli CLT'dir

İlgili: A/B test hesaplayıcı →

Bu içerik: