Top 5 açıq mənbə böyük data alətləri! (Big Data Tools)
Bu günkü günümüzdə data hər hansı digər materialdan daha çox dəyər daşıyır. Çünki, biz hal hazırda elə bir informasiya dövründə yaşayırıq ki, harada ki, data biznes deməkdir. Əhali sayı artdıqca ona uyğun olaraq data da artmaqdadır. Bu məlumatlar, gələcəkdə bazarların proqnozlaşdırılmasından başlayaraq, əhalinin xüsusi təbəqələri üçün məhsulları tənzimləməyə qədər bir çox şeyə kömək edə bilər. Bu sadəcə özəl müəssisələrə aid deyil, həmçinin, dövlətlər də böyük məlumatlara(Big Data) çox güvənirlər. Məlumatlar tez-tez çoxsaylı mənbələr vasitəsilə gəlir, bu da son məhsulun çox çirkli olmasını gətirib çıxarır. Buna analoji olaraq baxmaq istəsəz, Google-u açın və oraya hər hansı bir məlumatı və ya açar sözü axtarış verin . Nəticələr səhifəsi açıldıqda milyonlarla linkləri axtarış nəticəsi olaraq görə bilərik. Bu data yığını elə məhz həmin “Big Data”-dır. Gəlin indi “Big Data”-nın daha formal tərifinə baxaq.
Big Data- "Böyük məlumatlar" termini həm strukturlaşdırılmış, həm də strukturlaşdırılmamış formada mövcud olan böyük məlumat setləri deməkdir. Bu data setlər elə mürəkkəbdir ki, onlar ənənəvi məlumatların emalı tətbiqi proqramından daha çox məharətli data emal sistemli proqrama ehtiyac duyurlar. Bu proqram proqnozlaşdırıcı analitikanın məlumat toplusundan (data setlerindən) çıxartdığı dəyər prosesi zamanı qərar verə bilir. İstifadəçi davranış analitikası(User behavior analytics) və ya digər qabaqcıl məlumatların təhlili texnologiyaları da eyni dəyəri çıxartmaq üçün mənbə ola bilir. İndi böyük məlumatlarla işləməyə kömək etmək üçün olan bəzi vasitələrə nəzər salaq:
#1. Apache Hadoop-
Hal hazırda ən çox yayılmış və məşhur data emalı proqramlarından biridir. Həm strukturlaşdırılmamış, həm də strukturlaşdırılmış formatlarda böyük məlumatların emalı kontekstində sadəliyi və imkanları ilə tanınır.
#2. Lumify
Bazarda nisbətən yeni olmasına baxmayaraq, Hadoop üçün böyük bir alternativdir. Bu proqram mənbə və formatlarda böyük miqdarda data ölçülərini tez nəzərdən keçirə bilmə bacarığına malikdir. Başqa təsir edici xüsusiyyəti internet əsaslı interfeysidir, hansi ki, istifadəçilərə əlverişli data ilə 2D və 3D qrafikli vizuallaşdırmalar, dinamik histogramlar, tam mətn dolu axtarış(full text faceted search), və real vaxtda rejimində (real time) əlaqələri axtara bilir.
#3. Apache Storm
Apache Storm, real vaxt rejimində açıq mənbə kompüter sistemidir. Hadoop ilə və ya o olmadan istifadə edilə bilər və xüsusilə real vaxt emalı üçün limitsiz məlumat axınlarının işlənməsini asanlaşdırır. İstifadəsi çox asandır və proqramlaşdırma dilləri ilə yaxşı işləyə bilir. Belə ki, istifadəçi özü istədiyi dili seçə bilər.
#4. HPCC Systems Big Data
HPCC Hadoop üçün böyük bir alternativdir və məlumatların idarə edilməsi, çevrilməsi, sorğuların və datanın saxlanması üçün parlaq bir platformadır. O, üstün performansı, ölçüləbilirliyi və çevikliyi ilə tanınır.
#5. R-Programming
R-ın ən yaxşı xüsusiyyətlərindən biri həm proqram, həm də dil olmasıdır. R proqramlaşdırması bir proqramlaşdırma dili olduğu halda, layihə R isə proqramdır. Halbuki hər ikisi açıq mənbədir.
Mənbə: https://medium. com/@techcoder/top-5-open-source-big-data-tools-1f7bad857732