CNN Evrişimli Sinir Ağı Nedir?
CNN (Evrişimli Sinir Ağı) Nedir?
Normal bir insan bir kedi fotoğrafına baktığında kulakları, bıyıkları ve gözleri ayrı ayrı algılayıp "bu bir kedi" der. Bilgisayarlar ise sadece sayı matrisleri (piksel değerleri) görür.
CNN, insan beyninin görme merkezini taklit eden bir yapıdır. Görüntüyü bir bütün olarak işlemek yerine, üzerindeki desenleri (kenarlar, köşeler, dokular) öğrenerek nesneleri tanır.

Convolutional Neural Network architecture diagram resmi
CNN Nasıl Çalışır? (Katmanların Mantığı)
Bir CNN modeli temel olarak 4 ana aşamadan oluşur. Bunu bir "fabrika üretim hattı" gibi düşünebilirsiniz:
1. Evrişim Katmanı (Convolution Layer) – Özellik Çıkarıcı
Bu, işin mutfağıdır. Görüntünün üzerinde gezinen küçük filtreler (kernel) vardır.
- Ne yapar? Bir el feneri gibi görüntünün üzerinde dolaşarak belirli özellikleri arar (örneğin; dikey çizgiler, yatay çizgiler, renk geçişleri).
- Sonuç: Görüntüden "Özellik Haritaları" (Feature Maps) çıkarılır.
Örnek: İlk katman sadece "çizgileri" bulur. İkinci katman çizgileri birleştirip "göz şeklini" bulur. Sonraki katmanlar "yüzü" bulur.
2. Aktivasyon Katmanı (ReLU) – Filtreleyici
Genellikle evrişimden hemen sonra gelir.
- Ne yapar? Negatif değerleri (gereksiz bilgileri) sıfırlar ve modelin doğrusal olmayan (karmaşık) ilişkileri öğrenmesini sağlar. Siyah olan pikselleri (değeri negatif veya 0'a yakın olanları) tamamen kapatarak işlem yükünü azaltır ve odaklanmayı artırır.
3. Ortaklama Katmanı (Pooling Layer) – Boyut Küçültücü
Görüntüdeki her bir pikselin detayına ihtiyacımız yoktur. Önemli olan "orada bir göz var mı" bilgisidir, gözün tam hangi pikselde olduğu değildir.
- Ne yapar? Görüntü matrisini küçültür (Downsampling). Genellikle Max Pooling kullanılır; yani belirli bir alandaki en büyük (en baskın) değeri alır, gerisini atar.
- Fayda: İşlem gücünden tasarruf sağlar ve "aşırı öğrenmeyi" (overfitting) engeller.
4. Tam Bağlantılı Katman (Fully Connected Layer) – Karar Verici
Buraya kadar olan kısım "Özellik Çıkarma" (Feature Extraction) idi. Artık elimizde özetlenmiş, damıtılmış veriler var.
- Ne yapar? Matris halindeki veriyi düz bir listeye çevirir (Flattening) ve klasik bir Yapay Sinir Ağına (Standart DNN) sokar.
- Sonuç: Sınıflandırma yapar. Örneğin: %95 Kedi, %5 Köpek.
Neden Standart Bir DNN Yerine CNN Kullanıyoruz?
Eğer bir fotoğrafı (örneğin 1000x1000 piksel) standart bir Derin Sinir Ağına (DNN) verseydik:
- Veri Kaybı: Resmi düz bir çizgi haline getirmemiz gerekirdi. Bu da piksellerin komşuluk ilişkisini (mekansal bütünlüğü) bozar. Gözün burnun yanında olması bilgisini kaybederdik.
- İşlem Yükü: 1 milyon girişli devasa bir ağ kurmak gerekirdi, bu da eğitimi imkansız hale getirirdi.
CNN ise; pikselleri komşularıyla birlikte değerlendirir (Spatial Relationship) ve parametre paylaşımı sayesinde çok daha az işlem gücüyle çok daha yüksek başarı sağlar.
Özet Tablo
| Katman | Görevi | Analoji (Benzetme) |
| Input | Görüntüyü alır | Gözün ışığı alması |
| Convolution | Özellikleri (kenar, köşe) bulur | Büyüteçle detay inceleme |
| Pooling | Görüntüyü küçültür/özetler | Uzaktan bakıp ana hatları görme |
| Fully Connected | Karar verir (Sınıflandırma) | Beynin "Bu bir elmadır" demesi |
DNN Nedir?
DNN (Derin Sinir Ağı), insan beyninin çalışma şeklini taklit eden yapay sinir ağlarının, giriş ve çıkış arasında çok sayıda işleme katmanı (gizli katman) içeren karmaşık ve gelişmiş versiyonudur.
Bu çok katmanlı "derin" yapı, ağın basit veriler yerine görüntü, ses ve doğal dil gibi çok karmaşık verileri hiyerarşik olarak öğrenmesini ve anlamlandırmasını sağlar. Kısacası, derin öğrenmenin temelindeki güçlü motordur.
Yorumlar
Yorum Yaz