CNN Evrişimli Sinir Ağı Nedir?

CNN Evrişimli Sinir Ağı Nedir?

15.12.2025
255

CNN (Evrişimli Sinir Ağı) Nedir?

Normal bir insan bir kedi fotoğrafına baktığında kulakları, bıyıkları ve gözleri ayrı ayrı algılayıp "bu bir kedi" der. Bilgisayarlar ise sadece sayı matrisleri (piksel değerleri) görür.

CNN, insan beyninin görme merkezini taklit eden bir yapıdır. Görüntüyü bir bütün olarak işlemek yerine, üzerindeki desenleri (kenarlar, köşeler, dokular) öğrenerek nesneleri tanır.

Convolutional Neural Network architecture diagram resmi


CNN Nasıl Çalışır? (Katmanların Mantığı)

Bir CNN modeli temel olarak 4 ana aşamadan oluşur. Bunu bir "fabrika üretim hattı" gibi düşünebilirsiniz:


1. Evrişim Katmanı (Convolution Layer) – Özellik Çıkarıcı

Bu, işin mutfağıdır. Görüntünün üzerinde gezinen küçük filtreler (kernel) vardır.

  1. Ne yapar? Bir el feneri gibi görüntünün üzerinde dolaşarak belirli özellikleri arar (örneğin; dikey çizgiler, yatay çizgiler, renk geçişleri).
  2. Sonuç: Görüntüden "Özellik Haritaları" (Feature Maps) çıkarılır.

Örnek: İlk katman sadece "çizgileri" bulur. İkinci katman çizgileri birleştirip "göz şeklini" bulur. Sonraki katmanlar "yüzü" bulur.


2. Aktivasyon Katmanı (ReLU) – Filtreleyici

Genellikle evrişimden hemen sonra gelir.

  1. Ne yapar? Negatif değerleri (gereksiz bilgileri) sıfırlar ve modelin doğrusal olmayan (karmaşık) ilişkileri öğrenmesini sağlar. Siyah olan pikselleri (değeri negatif veya 0'a yakın olanları) tamamen kapatarak işlem yükünü azaltır ve odaklanmayı artırır.


3. Ortaklama Katmanı (Pooling Layer) – Boyut Küçültücü

Görüntüdeki her bir pikselin detayına ihtiyacımız yoktur. Önemli olan "orada bir göz var mı" bilgisidir, gözün tam hangi pikselde olduğu değildir.

  1. Ne yapar? Görüntü matrisini küçültür (Downsampling). Genellikle Max Pooling kullanılır; yani belirli bir alandaki en büyük (en baskın) değeri alır, gerisini atar.
  2. Fayda: İşlem gücünden tasarruf sağlar ve "aşırı öğrenmeyi" (overfitting) engeller.


4. Tam Bağlantılı Katman (Fully Connected Layer) – Karar Verici

Buraya kadar olan kısım "Özellik Çıkarma" (Feature Extraction) idi. Artık elimizde özetlenmiş, damıtılmış veriler var.

  1. Ne yapar? Matris halindeki veriyi düz bir listeye çevirir (Flattening) ve klasik bir Yapay Sinir Ağına (Standart DNN) sokar.
  2. Sonuç: Sınıflandırma yapar. Örneğin: %95 Kedi, %5 Köpek.


Neden Standart Bir DNN Yerine CNN Kullanıyoruz?

Eğer bir fotoğrafı (örneğin 1000x1000 piksel) standart bir Derin Sinir Ağına (DNN) verseydik:

  1. Veri Kaybı: Resmi düz bir çizgi haline getirmemiz gerekirdi. Bu da piksellerin komşuluk ilişkisini (mekansal bütünlüğü) bozar. Gözün burnun yanında olması bilgisini kaybederdik.
  2. İşlem Yükü: 1 milyon girişli devasa bir ağ kurmak gerekirdi, bu da eğitimi imkansız hale getirirdi.


CNN ise; pikselleri komşularıyla birlikte değerlendirir (Spatial Relationship) ve parametre paylaşımı sayesinde çok daha az işlem gücüyle çok daha yüksek başarı sağlar.


Özet Tablo

KatmanGöreviAnaloji (Benzetme)
InputGörüntüyü alırGözün ışığı alması
ConvolutionÖzellikleri (kenar, köşe) bulurBüyüteçle detay inceleme
PoolingGörüntüyü küçültür/özetlerUzaktan bakıp ana hatları görme
Fully ConnectedKarar verir (Sınıflandırma)Beynin "Bu bir elmadır" demesi


DNN Nedir?

DNN (Derin Sinir Ağı), insan beyninin çalışma şeklini taklit eden yapay sinir ağlarının, giriş ve çıkış arasında çok sayıda işleme katmanı (gizli katman) içeren karmaşık ve gelişmiş versiyonudur.

Bu çok katmanlı "derin" yapı, ağın basit veriler yerine görüntü, ses ve doğal dil gibi çok karmaşık verileri hiyerarşik olarak öğrenmesini ve anlamlandırmasını sağlar. Kısacası, derin öğrenmenin temelindeki güçlü motordur.


Yorumlar

İlk yorumu siz yazın.

Yorum Yaz