Hər bir data mütəxəssisinin işləyə bilməli olduğu Deep Learning üçün şəkil datasetləri
Hər bir sahədə olduğu kimi Deep Learning-i də yaxşı bilmək üçün praktika etmək əsasdır. Müxtəlif məsələləri - şəkil prosesləşdirilmədən tutmuş səs tanımaya qədər praktikada tətbiq etmək vacibdir. Hər məsələnin özünə məxsus nüansları və yanaşma şəkli vardır.
Bəs bu datanı haradan əldə edə bilərik?
Son zamanlarda çoxlu sayda ictimaiyyətə açıq olmayan, tədqiqat kağızlarında istifadə olunan müvafıq datasetləri görə bilərsiniz. Əgər siz yeni bacarıqlar öyrənmək və onları tətbiq etmək istəyirsinizsə, bu hal sizə problem yaradacaq.
Əgər siz belə bir problemlə qarşılaşırsınızsa, həll yolu kimi əlverişli, ictimaiyyətə açıq datasetləri nəzərdən keçirin.
Bu datasetləri necə istifadə edək?
İlk növbədə bu datasetlərin ölçüsü böyük olduğundan, əmin olun ki, bu böyük həcmli datanı yükləyə bilmək üçün internet bağlantısına sahibsiniz.
Bu datanı istifadə etmək üçün müxtəlif yollar vardır. Siz bu datasetləri bacarıqlarınızı inkişaf etdirmək və hər problemi necə müəyyənləşdirməyi və strukturlaşdırmağı öyrənmək üçün istifadə edə bilərsiniz.
Datasetlər 3 kateqoriyaya ayrılır:
Şəkil prosesləşdirilməsi,Təbii dil prosesləşdirilməsi və Səs/Danışıq prosesləşdirilməsi .
Şəkil Datasetləri
MNİST-Deep Learning datasetlərinin içində ən məşhurudur.O, əlyazılımı rəqəmlərdən, 60000 praktiki setindən və 10000 nümunə testlərindən ibarətdir. Real dünya datası üzərində yeni taktikaları və dərin tanıma tələb edən izləri az vaxt və əmək sərf etməklə öyrənmək üçün çox yaxşı data bazadır.
Ölçüsü - 50MB
Qeyd sayı - 10 sinifdə 70.000 şəkil
Coco - obyekt aşkarlama, seqmentasiya və altyazılı datasetləri ilə geniş ölçüyə malikdir. Onun bir neçə xüsusiyyətləri var:
Obyekt seqmentasiyası
Kontekst tanıma
Superpiksel materialların seqmentasiyası
330K şəkil (>200K yazı ilə)
1,5 milyon obyektin nümunəsi
80 obyekt kateqoriyası
91 material kateqoriyası
Hər şəkil üçün 5 açıqlama
Açar nöqtələri olan 250 000 nəfər
Ölçüsü - 25 GB(Sıxışdırılmış)
Qeyd sayı - 330K şəkil, 80 obyekt kateqoriyası, hər şəkil üçün 5 açıqlama.
İmageNet WordNet iyerarxiyasına uyğun olaraq təşkil olunmuş şəkillər datasetidir. WordNet təxmini 100.000 ifadə saxlayır ki, İmageNet bu ifadələrin hər biri üçün 1000 şəkil təmin edir.
Ölçüsü - 150 GB(Sıxışdırılmış)
Qeyd sayı - Ümumi şəkil sayı - 1.500.000; hər biri bir neçə məhdudlaşdırıcı çərçivə və müvafiq sinif etiketləri ilə.
Open Images 9 milyon şəkil veb adresləri datasetidir.
Ölçüsü - 500 GB(Sıxışdırılmış)
Qeyd sayı - 9.011.219 şəkil 5k etiketi ilə
VQA şəkil haqqında açıq-qapalı suallar verən datasetidir. Bu suallar görüntü və təbii dili başa düşməyi tələb edir. Bu datasetin maraqli xüsusiyyətləri bunlardır:
-
265.016 şəkil (COCO və abstrakt səhnələr)
-
Hər şəkil üçün ən azı 3 (ortalama 4,5) sual
-
Hər sual üçün əsaslı 10 doğru cavab
-
Hər sual üçün 3 mümkün (amma yanlış olmayan) cavab
-
Avtomatik hesablama sistemi
Ölçüsü - 25 GB(Sıxışdırılmış)
Qeyd sayı - 265.016 şəkil, hər şəkil üçün ən az 3 sual, sual başına 10 əsaslı doğru cavab.
The Street View House Numbers(SVHN)
Bu, obyekt aşkarlama alqoritmlərini inkişaf etdirmək üçün real dünya şəkil datasetidir. SVHN minimum data prosesləşdirməsini tələb edir. Bu, MNİST-ə çox oxşayır, amma burada daha çox data işarələnib (600.000 və üzəri şəkil). Data Google Küçə Görünüşündən görüntülənən ev nömrələri kolleksiyasıdır.
Ölçüsü - 2.5 GB
Qeyd sayı - 10 sinifdə 6,30,420 şəkil
Bu dataset şəkil sinifləndirmənin başqa bir formasıdır. O, 10 sinfin 60.000 şəklindən ibarətdir (hər sinif üstdəki şəkildəki kimi sıra şəklində düzülür). Cəm olaraq, 50.000 praktik şəklindən və 10.000 test şəklindən ibarətdir. Datasetlər 5-i məşğələ seti və 1 test seti olmaqla ayrılır.
Ölçüsü - 170 MB
Qeyd sayı - 10 sinifdə 60.000 şəkil
Fashion MNİST 60.000 praktiki şəkil və 10.000 test şəklindən ibarətdir.
MNİST-lə oxşar olan dəb məhsulu databazasıdır. Qurucular MNİST-dən istifadənin çox olduğuna inanıb, bunu birbaşa həmin dataseti yaratmaq üçün qoyublar. Hər şəkil boz rəngdədir.
Ölçüsü - 30 MB
Qeyd sayı - 10 sinifdə 70.000 şəkil