Data Science: 50+ korisnih linkova za učenje

Data science je evoluirala iz analitike. U poređenju sa njom, uključuje i podrazumeva mnogo više biznis znanja i razumevanja i samim tim je tehnički više usmerena ka mašinskom učenju, programiranju i prediktivnoj analitici. Više je fleksibilna i agilna, ima mogućnost da odgovori na pitanja koja nisu tradicionalna.

Big data predstavlja podatke koji dolaze u velikoj brzini i u količinama koje premašuju mogućnosti tradicionalnog software-a za skladištenje, procesuiranje i menažment podataka.

Data scientist predstavlja osobu koja kako se kaže mora da poznaje više programiranja od prosečnog statističara i više statistike od prosečnog programera.

Za sve one koji se nadaju da promene karijeru ili usmere je u oblast data science i big data, postoje mnoga pitanje na koje je potreban odgovor.  Ovaj tekst će pomoći da se pripremite i predstavlja pregled tekstova i linkova koji će olakšati put ka novim informacijama i znanjima koja su potrebna kako bi bili spremni za sve izazove koje donosi karijera Data Scientist-a.

Odakle da počnem?

Koje su veštine potrebne?

Koji programski jezik da naučim? Python ili R?

Koje blogove da pratim?

Data Science karijera

Pre nego što krenete da čitate i istražujete ovaj post, postavite sebi par pitanja:

-Da li se osećate dovoljno komforno da uplovite u svet podataka?

-Da li ste spremni da počnete od nule i da promenite karijeru?

-Da li ste zaista otvoreni i raspoloženi za sticanjem novih znanja? 

-Da li želite da postanete Data Scientist zato što je to trenutno jedna od najtraženijih karijera u svetu ili zato što iskreno mislite da ćete uživati  i voleti taj posao?

Najbolji način da pronađete odgovore na ova pitanja je da pregledate postove i video klipove u nastavku a koji detaljnije objašnjavaju dnevne aktivnosti i dužnosti svakog Data Scientist-a. Razmislite dobro da li vas ovaj posao i dalje interesuje ili ipak mislite da to nije za vas.

-Kako da postanete Data Scientist: Šta predstavlja Data Science? Experfy

-Kako da dobijete prvi posao iz oblasti Data Science Jean-Nicholas Hould

-Šta predstavlja Data Scientist? Quora

-Koje su mane u karijeri Data Scientist-a? Quora

-Život Data Scientist-a (VIDEO)  Josh Wills

-Prljave tajne Data Scientist-a (VIDEO) Hilary Mason

-Karijera u Data Science industriji i  različite uloge u njoj  Springboard

-Q & A za sve koji žele da postanu Data Scientist-i Converge

Tranzicija i promena karijere

Uvek je korisno i interesantno pročitati kako su drugi podneli promenu kroz tranziciju iz jedne karijere u drugu. U nastavku su izdvojeni tekstovi o promeni, očekivanjima, projektima i svemu onome što su naučili. Treba napomenuti da se članci većinom tiču tranzicije iz akademskog sveta u biznis svet.

-Godinu dana kao Data Scientist u Stack Overflow David Robinson

-Data Science mitovi i istine Insight Data Science

-Prelazak iz akademskih voda u data science svet MultiThreaded

-Vodič za prelaz u Data Science svet KDNuggets

-Growth Hacker avantura. Na pravom mestu u pravo vreme Converge

Besplatni online data science resursi

Sada kada znate da ste spremni da napravite korak napred i promenu, potrebno je da naučite i usavršite veštine koje će vam biti potrebe za svakodnevne aktivnosti na budućem, vrlo interesantnom poslu.

U nastavku su dve vrlo dugačke liste svih linkova sa edukativnim karakterom o skoro svim temama koje se tiču Data Science karijere.

-Kako da postanem Data Scienctist? Quora

-Fantastičan Data Science izbor alata na Trello platformi Trello

Statistika i nauka o podacima

Statistika je vrlo esencijalna kada je u pitanju rad sa podacima i samim tim morate imati razumevanja i znanja oko osnovnih pojmova statistike. Sve oko statističkih testova, distribucije, linearne regresije itd je veoma korisno za rad sa podacima. Korisni tekstovi i kursevi za početak su:

-Verovatnoća i statistika Carnegie Mellon University 

-Statistika 101: Verovatnoća (VIDEO) Harvard 

-Statistika u kombinaciji sa R programskim jezikom Coursera / Duke University

-Statistika: Interaktivni kurs  OnlineStatBook

-Digitalni udžbenik verovatnoće i statistike Statlect

SQL i baza podataka 

Pre nego što počnete analizu, potrebni su vam podaci. Velika većina podataka sa kojima ćete manipulisati i sa kojima ćete se susretati tokom svakodnevnog posla su podaci koji su skladišteni u relacionoj bazi podataka. SQL (Structured Query Language) je alat koji se najčešće koristi za izvlačenje podataka iz baze.

-SQL The Prequel: Excel vs Baze podataka School of Data

-Pristup iz ugla tabela i iz ugla baza podataka Eagereyes

-Kako da napravite iskorak od Excel ka SQL Mode

-Objašnjenje racionalnih i ne relacionalnih baza podataka Ignored by Dinosaurs

-SQL za analizu podataka Mode

Python programski jezik

Python predstavlja besplatan i open-source  programski jezik koji je postao izuzetno popularan kada je u pitanju i analiza podataka. Python ima jako veliku i snažnu kolekciju datoteka (kodovi koji vam pomažu da završite rutinske zadatke brže) za manipulaciju podataka, vizualizaciju, mašinsko učenje i druge.

-Odakle da krenem sa učenjem Python-a (10+ linkova) Quora

-Python kolekcija popularnih datoteka Mode

-8 resursa za učenje analize podataka sa Python panda datotekama Data School

-Interaktivno učenje LearnPython

-Upoznavanje sa Python-om za Data Science pozicijiu DataCamp

-Kurs Python programiranja Codecademy

-Učenje Python-a preko mobilnog telefona i aplikacije Learn Python SoloLearn

R programski jezik

R, kao što je to slučaj i sa Python-om, predstavlja besplatan open source programski jezik. Dok je Python pre svega počeo prvenstveno kao programski jezik za programere, R je napravljen sa ciljem za statističko izračunavanje i vizualizaciju podataka. R datoteke su otprilike ekvivalent Python datotekama.

-Kompletan tutorijal kako da naučite R programski jezik za Data Science Analytics Vidhya

-Besplatni resursi za učenje R deo 1  CrossValidated

-Besplatni resursi za učenje R deo 2 GitHub DataScienceMasters

-Upoznavanje sa R programskim jezikom DataCamp

Ako se dvoumite da li da naučite Python ili R programski jezik (sto predstavlja čest slučaj) pogledajte fantastičan DataCamp infografik koji detaljno objašnjava i poredi oba programska jezika i njihove prednosti i mane u zavisnosti šta želite da postignete sa njihovim korišćenjem.

Mašinsko učenje

U zavisnosti od kompanije i pozicije, verovatno nećete imati susreta sa ovom oblasti ali nije na odmet da se znaju osnove, pogotovu koje tehnike su odgovarajuće u kojoj situaciji.

-Najbolji resursi i tekstovi za učenje mašinskog učenja Machine Learning Mastery

-Kako da naučim mašinsko učenje? Quora

-Kurs mašinskog učenja  Stanford University

-Kurs mašinskog učenja (studija slučaja) University of Washington

Vizualizacija podataka

Vizualizacija podataka predstavlja takođe vrlo bitan i sastavni deo u radu svakog Data Scientist-a. Kvalitetni prikazi podataka u slici su jako bitni iz prostog razloga što samo analiza nije dovoljna. Potrebno je i objasniti podatke saradnicima i kolegama kroz sliku i vizuelni prikaz.

-Alati za vizualizaciju podataka Visualising Data

-Preporuke i resursi za tekstove o vizualizaciji MulinBlog

-Pričanje priče kroz vizualizaciju podataka  Juice Analtytics

Online treninzi i kursevi

Ako tražite treninge sa planom rada, online kursevi predstavljaju odličan način da se nauče i usavrše veštine. Večina je besplatna a ako želite sertifikakat moraćete da izdvojite od 20$ do 100$ u zavisnosti od kursa. U nastavku su linkovi svih poznatih i kvalitetnih online platformi za učenje preko interneta  i njihova ponuda ka svim kursevima koji se tiču data science i nauke o podacima.

Coursera

Udacity

edX

Udemy

DataQuest

DataCamp

O Reilly

DataOrigami

Springboard 

Lista svih kurseva sa detaljnim objašnjenjima šta sadrže LearnDataSci

90+ aktivnih blogova o data science

Učenje naravno ne prestaje kada konačno osvojite posao koji želite i samim tim  uvek morate biti informisani o svim relevantnim stvarima koje se tiču vaše industrije.

KDNuggets sadrži sjajne data science tesktove i ima takođe listu sa preko 90+ aktivnih blogova koji se bave temama od analitike pa do big data, mašinskog učenja, data mining itd.

Newsletters

Data Science Weekly

Data Elixir

Data Driven Daily

The Analytics Dispatch (archive here)

Postgres Weekly

Python Weekly

O’Reilly Data Newsletter

YouTube kanali

Data School – Data science for beginners! | Data Science

edureka! | Data Science

Zipfian Academy | Data Science

David Langer | Data Science + R

Derek Kane | Data Science

MarinStatsLectures | Statistika

LearnR | R programiranje

Christoph Scherber | Statistika

Brandon Foltz | Statistika

statisticsfun | Statistika

Java and R Tutorials | R programiranje

bigdata simplified | Big data

Derek Banas | SQL

Podcasts

The PolicyViz

Not So Standard Deviations

What is the Point

Partially Derivative

Reddit zajednice

r/dataisbeautiful

r/visualization

r/datascience

r/python

r/machinelearning

Leave a Comment

Your email address will not be published. Required fields are marked *