[email protected] +994997971227

Hər bir data mütəxəssisinin işləyə bilməli olduğu Deep Learning üçün şəkil data setləri

Əsas səhifə >Data bloqu >Hər bir data mütəxəssisinin işləyə bilməli olduğu Deep Learning üçün şəkil data setləri

Hər bir data mütəxəssisinin işləyə bilməli olduğu Deep Learning üçün şəkil datasetləri

Hər bir sahədə olduğu kimi Deep Learning-i də yaxşı bilmək üçün praktika etmək əsasdır. Müxtəlif məsələləri - şəkil prosesləşdirilmədən tutmuş səs tanımaya qədər praktikada tətbiq etmək vacibdir. Hər məsələnin özünə məxsus nüansları və yanaşma şəkli vardır.

Bəs bu datanı haradan əldə edə bilərik?

Son zamanlarda çoxlu sayda ictimaiyyətə açıq olmayan, tədqiqat kağızlarında istifadə olunan müvafıq datasetləri görə bilərsiniz. Əgər siz yeni bacarıqlar öyrənmək və onları tətbiq etmək istəyirsinizsə, bu hal sizə problem yaradacaq.

Əgər siz belə bir problemlə qarşılaşırsınızsa, həll yolu kimi əlverişli, ictimaiyyətə açıq datasetləri nəzərdən keçirin.

Bu datasetləri necə istifadə edək?

İlk növbədə bu datasetlərin ölçüsü böyük olduğundan, əmin olun ki, bu böyük həcmli datanı yükləyə bilmək üçün internet bağlantısına sahibsiniz.

Bu datanı istifadə etmək üçün müxtəlif yollar vardır. Siz bu datasetləri bacarıqlarınızı inkişaf etdirmək və hər problemi necə müəyyənləşdirməyi və strukturlaşdırmağı öyrənmək üçün istifadə edə bilərsiniz. 

Datasetlər 3 kateqoriyaya ayrılır:

Şəkil prosesləşdirilməsi,Təbii dil prosesləşdirilməsi və Səs/Danışıq prosesləşdirilməsi .

                                    Şəkil Datasetləri

MNİST

MNİST-Deep Learning datasetlərinin içində ən məşhurudur.O, əlyazılımı rəqəmlərdən, 60000 praktiki setindən və 10000 nümunə testlərindən ibarətdir. Real dünya datası üzərində yeni taktikaları və dərin tanıma tələb edən izləri az vaxt və əmək sərf etməklə öyrənmək üçün çox yaxşı data bazadır.

Ölçüsü - 50MB

Qeyd sayı - 10 sinifdə 70.000 şəkil

MS-COCO

Coco - obyekt aşkarlama, seqmentasiya və altyazılı datasetləri ilə geniş ölçüyə malikdir. Onun bir neçə xüsusiyyətləri var:

Obyekt seqmentasiyası

Kontekst tanıma

Superpiksel materialların seqmentasiyası

330K şəkil (>200K yazı ilə)

1,5 milyon obyektin nümunəsi

80 obyekt kateqoriyası

91 material kateqoriyası

Hər şəkil üçün 5 açıqlama

Açar nöqtələri olan 250 000 nəfər 

Ölçüsü - 25 GB(Sıxışdırılmış)

Qeyd sayı - 330K şəkil, 80 obyekt kateqoriyası, hər şəkil üçün 5 açıqlama.

 

İmageNet

İmageNet  WordNet  iyerarxiyasına uyğun olaraq təşkil olunmuş şəkillər datasetidir. WordNet təxmini 100.000 ifadə saxlayır ki, İmageNet bu ifadələrin hər biri üçün 1000 şəkil təmin edir. 

Ölçüsü - 150 GB(Sıxışdırılmış)

Qeyd sayı - Ümumi şəkil sayı - 1.500.000; hər biri bir neçə məhdudlaşdırıcı çərçivə və müvafiq sinif etiketləri ilə.

Open Images Dataset

Open Images 9 milyon şəkil veb adresləri datasetidir.

Ölçüsü - 500 GB(Sıxışdırılmış)

Qeyd sayı - 9.011.219 şəkil 5k etiketi ilə

 

VisualQA

VQA  şəkil haqqında açıq-qapalı suallar verən datasetidir. Bu suallar görüntü və təbii dili başa düşməyi tələb edir. Bu datasetin maraqli xüsusiyyətləri bunlardır:

  • 265.016 şəkil (COCO və abstrakt səhnələr)

  • Hər şəkil üçün ən azı 3 (ortalama 4,5) sual

  • Hər sual üçün əsaslı 10 doğru cavab

  • Hər sual üçün 3 mümkün (amma yanlış olmayan) cavab

  • Avtomatik hesablama sistemi

Ölçüsü - 25 GB(Sıxışdırılmış)

Qeyd sayı - 265.016 şəkil, hər şəkil üçün ən az 3 sual, sual başına 10 əsaslı doğru cavab.

The Street View House Numbers(SVHN)

Bu, obyekt aşkarlama alqoritmlərini inkişaf etdirmək üçün real dünya şəkil datasetidir. SVHN minimum data prosesləşdirməsini tələb edir. Bu, MNİST-ə çox oxşayır, amma burada daha çox data işarələnib (600.000 və üzəri şəkil). Data Google Küçə Görünüşündən görüntülənən ev nömrələri kolleksiyasıdır.

Ölçüsü - 2.5 GB

Qeyd sayı - 10 sinifdə 6,30,420 şəkil

 

CIFAR-10

Bu dataset şəkil sinifləndirmənin başqa bir formasıdır. O, 10 sinfin 60.000 şəklindən ibarətdir (hər sinif üstdəki şəkildəki kimi sıra şəklində düzülür). Cəm olaraq, 50.000 praktik şəklindən və 10.000 test şəklindən ibarətdir. Datasetlər 5-i məşğələ seti və 1 test seti olmaqla ayrılır.

Ölçüsü - 170 MB

Qeyd sayı - 10 sinifdə 60.000 şəkil

 

Fashion-MNIST

Fashion MNİST 60.000 praktiki şəkil və 10.000 test şəklindən ibarətdir.

MNİST-lə oxşar olan dəb məhsulu databazasıdır. Qurucular MNİST-dən istifadənin çox olduğuna inanıb, bunu birbaşa həmin dataseti yaratmaq üçün qoyublar. Hər şəkil boz rəngdədir.

Ölçüsü - 30 MB

Qeyd sayı - 10 sinifdə 70.000 şəkil

Maya Bayramova

None