Google Analytics API v4 + R programski jezik

Google analitika je jedna od najpopularnijih alatki za setup, reporting i analizu podataka koji se tiču sajta. Google Analytics takođe nudi besplatan API (application programming interface) u cilju eksportovanja podataka sa GA servera ka eksternim sistemima. Tutorijal iz nastavka je pre svega za sve one koji imaju napredno znanje i aktivno koriste Google Analytics alat i za sve one koji bi želeli da nauče kako da povežu ovaj alat kao dodatni izvor podataka kroz R programski jezik. Važno je takođe posedovati i osnovno znanje R-a.

U nastavku su samo neki osnovnih primera vizualizacije i analiza koje je moguće uraditi sa podacima.

Kako bi uspešno iskoristili ovaj tutorijal pretpostavka je da imate pristup Google Analytics nalogu i da je vaš Gmail uspešno povezan tj. da mu je dozvoljeno da pristupi GA alatu.

R programski jezik

R je programski jezik koji je jedan od najbrže rastućih jezika za statističku analizu podataka. Sa bazom korisnika koja raste (trenutno između 1-2 miliona) ima široku upotrebu kod statističara, analitičara i data minera.

U ovom tutorijalu je samo mali deo onoga šta možete da uradite koristeći R programski jezik.

  • najbrže rastući jezik za statističku analizu podataka
  • besplatan je
  • kvalitetne biblioteke
  • puno materijala za edukaciju i učenje (blogovi, kursevi, knjige)
  • velika zajednica širom interneta
  • spreman za razne platforme (Windows, Mac, Unix)

R Studio

R Studio predstavlja jedan od najkorišćenijih IDEs i najlakši nači da počnete sa R-om. Sa njim možete pisati, editovati i pokrenuti svoj R kod, a takođe videti outpute kod i vizualizacije. Besplatna verzija uključuje Open Source License. Možete ga skinuti na ovom linku download

 

Setup Google Analytics API v4 + R

googleAnalyticsR - Google Analytics API to R

Kako bi se uspešno povukli podaci sa Google Analytics servera i uvukli u R Studio kroz API biće potrebno da se upotrebi eksterna biblioteka. Ona će vam pomoći da pre svega autorizujete konekciju, povučete podatake i kasnije kroz dataframe analizirate iste.

googleAnalyticsR

Trenutno jedna od najboljih eksternih biblioteka za povlačenje podataka iz Google Analytics u R je definitivno googleAnalyticsR biblioteka koju je kreirao Mark Edmonson. On je dobro poznat analitičkog zajednici pre svega po svom fenomenalnom doprinosu i razvoju kvalitetnih biblioteka kao na primer googleAuthR, bigQueryR, searchConsoleR i ostale.

googleAnalyticsR sadrži:

  • Prva Google Analytrics Reporting v4 API biblioteka za R programski jezik
  • v4 uključuje dinamičke calculated metrike, pivote, histograme, batching itd
  • v4 API Explorer
  • Multi user log-in za Shiny App
  • Integracija sa BigQuery Google Analytics Premium/360
  • Jednostavna autentifikacija kroz googleAuthR
  • Automatski batching i izbegavanje sampling-a

Analiza podataka

Nakon što smo uspešno instalirali potrebne pakete i autentifikovali se, prelazimo na analizu podataka i povlačenja podatka direktno iz GA API-a.

Napisali smo upit gadata koji se odnosi na povlačenje podataka sa GA servera i konkretno se tiče  perioda od početka 2016. godine pa do septembra. Za metriku je definisana poseta dok su za dimenziju definisan datum.

Vizualizacija Google Analytics podataka kroz R i GGplot2

R programski jezik ima puno interesantnih biblioteka za vizualizaciju podataka. Jedna od najpopularnijih je ggplot2 koja je sad deo tidyverse. Ona je najbolji način da vizualizujete podatke kroz R.

Line

U nastavku je jednostavan line chart koja prikazuje broj poseta po mesecima.

google analytics api v4 r line plotLine

google analytics api v4 r line chart

 

Histogram

google analytics api v4 r histogramScatter plot

Grafički prikaz datuma i poseta u periodu od 9 meseci.

 

google analytics api v4 r scatter plot

Scatter plot point size

google analytics api v4 r scatter plot point

Scatter plot + trend

Kako bismo imali uvid i u trend tokom određenog vremenskog perioda na scatter plotu dodaćemo i liniju za trend.

google analytics api v4 r scatter plot trendBox

U primeru je vizualizacija saobraćaja tokom dana u nedelji. Ovaj prikaz pomaže u razumevanju da li je naš saobraćaj sezonski i kojim danima dolazi najviše ljudi. Preko ovog chart-a možemo da ilustrujemo distribuciju broja poseta svakog dana u nedelji.

Biće potrebno da se napiše poseban upit koji će povući druge podatke nego što je to bio slučaj sa prethodnim upitima a nakon toga sledi vizualizacija. Treba napomenuti da u Google Analytics-u, dayOfWeek označava sledeće:

  • 0-Sunday
  • 1-Monday
  • 2-Tuesday
  • 3-Wednesday
  • 4-Thursday
  • 5-Friday
  • 6-Saturday

google analytics api v4 r box plot

Poređenje po uređajima

Kako bi analizirali posetu po uređaju potrebno je da napišemo novi upit koji će povući podatake o uređajima, datumu i posetama (sessions).

Sa ovim grafičkim prikazom možemo uvideti koliko je poseta bilo i preko kog tipa uređaja u željenom vremenskom periodu.

Kao što se vidi i na chart-u, korisnici su definitivno više posećivali sajt preko desktop-a.

google analytics api v4 r device category

 

Zaključak

Verujem da ako ste došli do kraja tutorijala da ste uspeli uspešno da ispratite sve korake i da kreirate vizualizacije koje se tiču vaših podataka iz Google analitike. Za dodatna pitanja i predloge budite slobodni da me kontaktirate.

Srećno analiziranje!

 

Leave a Comment

Your email address will not be published. Required fields are marked *