16 besplatnih alata za analizu podataka

Istraživanje i analiza podataka je neizbežan deo aktivnosti koji je potreban za predviđanje i donošenje odluka na osnovu podataka. Ne možete da pristupite predviđanjima ukoliko ne znate šta se desilo u prošlosti. Najvažnija veština kako bi se usavršila analiza podataka je radoznalost, koja ništa ne košta, a ipak je nemaju svi.

U nastavku je 18 besplatnih alata za analizu podataka koji će vam pomoći da što brže i lakše dođete do potrebnih informacija. Za ove alate nije potrebno znanje programiranja za razliku od Python-a (u kome je bilo reči na ovom linku) i statističkog alata R, kome ću tek posvetiti prostora u budućnosti.

 

1. TRIFACTA

trifacta-analiza-podataka

Alat Wrangler kompanije Trifacta predstavlja alat za manipulaciju podataka  i čišćenje istih. Dobro je poznato da Excel ima ograničenje što se tiče veličine podataka, dok ovaj alat nema taj problem i može se slobodno raditi sa velikim setovima podataka (big data). Sa ovim alatom se mogu brzo i lako generisati izveštaji po potrebi i želji.

Download 

2. RAPIDMINER

rapidminer-analiza-podataka

Ovaj alat je bio jedan od lidera na Gartner 2016 listi Magic Quadrant for Advanced Analytics. On nije samo za čišćenje podataka nego je pre svega odličan i specijalizovan za pravljenje modela za mašinsko učenje i poseduje sve algoritme koji se najčešće koriste. Takođe može se kombinovati sa onima koji koriste Python i R za modele.

Sa razlogom nastavlja da zadivljuje ljude širom sveta svojim neverovatnim softverskim mogućnostima i brzinom.

Download

3. RATTLE GUI

rattle-gui-r-project-analiza-podataka

Ako ste ikad koristili statistički open souce programski jezik R, ali niste uspeli da se snađete, Rattle bi bila odlična zamena jer je njegov GUI izgrađen na bazi R. Da bi se koristio, mora da se instalira R. Ovaj alat je više od alata za rudarenje podataka (data mining). Rattle podržava razne algoritme za mašinsko učenje kao što su Tree, SVM, Boosting, Neural Net, Survival, Linear models i druge.

U poslednje vreme se jako puno koristi i po podacima CRAN, Rattle se instalira preko 10.000x svakog meseca. Pruža dovoljno opcija za istraživanje, transformaciju i modelovanje za samo par klikova. Međutim ima manje opcija nego IBM SPSS za statističku analizu iz prostog razlog što se IBM SPSS plaća dok je Rattle GUI besplatan.

Download

4. QLIKVIEW

qlikview

Qlikview je jedan od najpopularnijih dostupnih alata za poslovnu inteligenciju širom sveta. Ima sjajne mogućnosti za vizualizaciju podataka i takođe bezbroj mogućnosti za rad sa podacima. Ovo nije alat za statističku analizu ali je odličan za istraživanje podataka, trendove itd.

Download

5. WEKA

weka_analiza-podataka

Prednost korišćenja Weka alata je to što je vrlo lak za upotrebu. Dizajniran je u Java programskom jeziku i prvenstveno je bio za istraživačke namene na Univerzitetu Wakaito ali je kasnije postao prihvaćen sve više i više od ljudi širom sveta. Koristi se najviše za mašinsko učenje i sam interfejs je dovoljno intuitivan da bi se posao završio brzo i efikasno. Međutim, do sada se nije okupila dovoljno jaka i kvalitetna zajednica oko ovog alata kao što je to slučaj sa R i Python-om.

Download

6. KNIME

knime-data-analysis

Knime je vrlo sličan RapidMiner alatu i pruža platformu koja je opensource i fokusira se na analizu podataka koji se kasnije mogu povezati sa ostalim proizvodima. Imaju napredna rešenja za vizualizaciju podataka i napredne algoritme za mašinsko učenje. Takođe korišćenjem ovog alata se mogu izgraditi modeli.

Trening lekcije su dostupne na njihovom sajtu kako bi se olakšao rad i učenje.

Download

7. ORANGE

orange-data-analysis-c2

Ovaj alat je dizajniran da pruži interaktivnu vizualizaciju podataka i zadatke koji se tiču rudarenja podataka (data mining). Na YouTube-u se mogu pronaći dosta tutorijala kako da se ovaj alat iskoristi na pravi način.

Ima sopstevenu i veliku biblioteku za data mining zadatke.

Download

8. TABLEAU PUBLIC

Tableau

Tableau Public predstavlja alat za vizualizaciju podataka i ovo je besplatna verzija ovog programa koja takođe ima i verzije koje se plaćaju. Detaljniji opis o ovom alatu i kako može da se najlakše nauči može se pročitati ovde. Predstavlja, pored alata Qlikview-a, jedan od najmoćnijih software-a za poslovnu inteligenciju trenutno na svetu. Superioran je i veoma brz kada je u pitanju vizualizacija i istraživanje podataka  i njihova analiza kroz razne vrste grafičkih prikaza.

Ako želite da razumete podatke u realnom vremenu, Tableau može itekako da završi posao.

Download

9. DATA SCIENCE STUDIO (DSS)

dataiku-analiza-podataka

Vrlo moćan alat koje je dizajniran da poveže tehnologiju, biznis i podatke. Podeljen je u dva segmenta, sa programiranjem i bez programiranja. Kompletan paket može da koristi bilo koja organizacija i kompanija koja ima plan da razvija i gradi modele na mreži. Data Science Studio je takođe moćan kad je u pitanju i stvaranje pametne mreže aplikacija za rešavanje problema. Takođe obuhvata i mogućnost koja integriše timove na projektima. Pored svega što nudi, najinteresantniji deo je taj što možete reprodukovati svoj rad u ovom alatu kroz Git.

Download

10. OPENREFINE

openrefine-analiza-podataka2

 

Ovaj alat je mnogima bio poznat kao Google Refine ali izgleda je ovaj projekat odbacen od strane Google-a bez jasnog razloga. Svakako sada je aktuelan pod promenjenim imenom, OpenRefine. Pored mnogobrojnih open source alata, OpenRefine  je predviđen za  neuređene podatke; brisanje,  transformisanje i  oblikovanje za prediktivne modele.

Kao zanimljivost,  u toku građenja modela, 80% vremena analitičara se posvećuje čišćenju podataka. Koristeći  OpenRefine, analitičari ne samo da će uštedi na svom vremenu, nego  će moći i da ga produktivno iskoriste.

Download

11. TALEND

talend-analiza-podataka

Donošenje odluka je pretežno na osnovu podataka i više nije praksa da se odluke donose na osnovu osećaja kao što je to bilo pre. Ovaj alat upravo pomože u tome, otkriva podatke i doprinosi tome da se zaključći brze i efikasnije donesu. Zapravo on je alat koji služi za čišćenje, transformisanje i vizualizaciju podataka.

Takođe, on nudi interesantnu funkciju koja automatitizuje stvari koje možete da sačuvate ili eventualno prepravite  na novom  setu podataka.  Ova inovacija je  jedinstvena i  ne nalazi se  u mnogim alatima. Isto tako, podrazumeva i auto discovery gde pruža ‘’pametne’’ sugestije korisnicima za naprednije analize podataka.

Download

12. DATACRACKER

datacracker-analiza-podataka

Ovo je softver za analizu podataka koji je specijalizovan za  podatke koji su se prikupili preko raznih istraživanja i anketa. Mnoge kompanije rade istraživanja i ankete, ali se muče sa njihovom statističkom analizom. Takođe dobro je poznato da podaci iz istraživanja nikada nisu čisti, sastoje se iz puno neprikadnih vrednosti i uvek potrebno da se očiste pre analize.

DataCracker alat smanjuje i rešava probleme i samim tim poboljšava efikasnost u radu sa neurednim podacima. Dizajniran je tako da može da učita podatke iz svih većih programa  koje sprovode ankete na internetu, kao što su SurveyMonkey, Survey Gizmo itd. Postoji nekoliko interaktivnih elemenata koji pomažu da se bolje razumeju podaci.

Download

13. DATA PREPARATOR

Ovaj alat je izgrađen u Javi kako bi nam pomogao  u istraživanju podataka, čišćenju i analizi podataka. On uključuje  različite pakete za numeraciju, skaliranje, statistiku, vizualizaciju itd. Njegov GUI je intuitivan i jednostavan za razumevanje i kada počnete da radite na njemu,  sigurano je da vam neće oduzeti mnogo vremena kako bi shvatili kako funkcioniše.

Jedinstvena prednost ovog alata je ta što se setovi podataka koji se koristi za analizu ne čuvaju u memoriji  računara. To je bitna informacija jer to znači da možete raditi  na velikim  setovima podataka (big data)  bez ikakvih problema sa brzinom procesora ili memorijskom kao što je to slučaj sa nekim drugim alatima slične namene.

Download

14. DATA APPLIED

Ovaj moćan interaktivni alat je dizajniran da izgradi, podeli i dizajnira izveštaje analize podataka. Stvaranje vizualizacije nad velikih setovima podataka (big data) ponekad može biti problematično. Ali ovaj alat je robustan u vizualizaciji velike količine podataka koristeći tree maps. Kao i svi drugi alati koji su spomenuti, ima funkciju za transformaciju podataka, statističke analize, detekciju anomalija itd.

Download

15. DATA WRAPPER

Izuzetno brz software za vizualizaciju podataka koji se ipak ne može porediti sa Tableau i Qlikview. Bez obzira na to vredi ga isprobati jer je u browseru i ne zahteva nikakvu instalaciju softvera.

Link

16. TANAGRA PROJECT

Verovatno vam se neće svideti je je staromodan, ali ovaj besplatni softver za rudarenje podataka (data mining) je dizajniran da gradi modele za mašinsko učenje. Tanagra projekat je počeo kao slobodni softvera za akademske i istraživačke svrhe i samim tim daje dovoljno prostora da se osmisli sopstveni algoritam i doprinese projektu.

Neki od njegovih ograničenja uključuje nedostupnost različitog izvora podataka, direktan pristup bazi podataka itd.

Download

Leave a Comment

Your email address will not be published. Required fields are marked *