CIFAR-10 Nedir? (Kanada Gelişmiş Araştırma Enstitüsü) veri kümesi, genel olarak makine öğrenmesi algoritmalarını ve bilgisayar vizyonunu öğretmek için kullanılan bir görüntü koleksiyonudur. Bu, makine öğrenimi araştırması için en yaygın kullanılan veri setlerinden biridir. CIFAR-10 Veri Kümesi, 10 farklı sınıfta 60.000 32×32 renkli görüntü içerir. 10 farklı sınıfta uçaklar, arabalar, kuşlar, kediler, geyikler, köpekler, kurbağalar, atlar, gemiler ve kamyonlar bulunur. Her sınıfın 6.000 görüntüsü vardır.

Fotoğraflardaki nesneleri tanımak için kullanılan bilgisayar algoritmaları genellikle örnek olarak öğrenir. CIFAR-10, bilgisayarınıza nesneleri nasıl tanıyacağınızı öğretmek için kullanabileceğiniz bir resim koleksiyonudur. CIFAR-10’daki görüntüler düşük bir çözünürlüğe (32×32) sahip olduğundan, bu veri seti araştırmacıların neyin işe yaradığını görmek için farklı algoritmaları hızla denemelerine izin verebilir. Farklı evrimli sinir ağları CIFAR-10’daki görüntüleri en iyi tanıma eğilimindedir.

Modern Sonuçlarla Araştırma Çalışması CIFAR-10

CIFAR-10 veri setinde en gelişmiş sonuçları elde ettiğini iddia eden araştırma makalelerinin bir tablosudur. Tüm kağıtlar, görüntüyü çevirmek veya kaydırmak gibi aynı ön işleme yöntemleriyle standartlaştırılmaz. Bu nedenle, işlerin durumu ile ilgili bir makalenin ifadesinin önceki tekniğin önceki ifadesinden daha yüksek bir hata oranına sahip olması olasıdır, ancak yine de geçerli olabilir.

CIFAR-10 Nedir?

CIFAR 10
CIFAR 10

CIFAR-10, nesne tanıma için kullanılan yüklü bir bilgisayar vizyonu veri kümesidir. 80 milyon minik görüntüden oluşan bir veri grubunun alt kümesidir ve sınıf başına 6.000 görüntü içeren, 10 nesne sınıfından birini içeren 60.000 32×32 renkli görüntüden oluşur. Alex Krizhevsky, Vinod Nair ve Jeffrey Hinton tarafından toplanmıştır.

Kaynak Görüntü Veri Kümesini Anlama

Bir partinin ilk verileri bir dizi olarak ifade edilen bir matristir (10000 x 3072). Sütun sayısı (10000) örnek veri miktarını gösterir. CIFAR-10 / CIFAR-100 veri setinde belirtildiği gibi, satır vektörü (3072) 32×32 piksel renkli bir görüntüdür. Bu proje sınıflandırma görevleri için CNN kullanacağından, orijinal satır vektörü uygun değildir. Görüntü verilerini CNN modeline aktarmak için, giriş tensörü boyutunun olması gerekir. Bu sizin tercihinize bağlıdır (conv2d akış tensörünü kontrol edin). 

CNN TO TENSORFLOW
CNN TO TENSORFLOW

Bu Forma Nasıl Dönüştürülür?

Resmin çizgi vektörü, tam olarak aynı sayıda öğeye sahiptir, 32 * 32 * 3 == 3072 değerini hesaplarsanız. Çizgi vektörünü bir şekle dönüştürmek için (genişlik x yükseklik x num_channel) iki adım gerçekleştirmeniz gerekir. İlk adım, şekil değiştirme fonksiyonunu kullanmak, ikinci adım ise transpoze fonksiyonunu numpy’de kullanmaktır.

Tanım olarak, resmi resmi web sitesinde, formun değiştirilmesi, verileri değiştirmeden diziyi yeni bir forma dönüştürür. Burada, verileri değiştirmeden ifade önemli bir parçasıdır, çünkü verilere zarar vermek istemezsiniz. Eğitim partileri kalan görüntüleri rastgele sırayla içerir, ancak bazı eğitim partileri bir sınıftan diğerine göre daha fazla görüntü içerebilir.

 

https://pythondunyasi.com/yapay-zeka-ve-derin-ogrenme/


0 yorum

Bir Cevap Yazın

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d blogcu bunu beğendi: