Spark och R

En utbildning i hur ni skalar upp dataanalys och Machine Learning med Spark

Modern dataanalys och Machine Learning använder sig av programmeringsspråk som R eller Python. En nackdel med dessa programmeringsspråk är att det kan vara svårt att använda dem i stor skala. Apache Spark är ett Open Source-ramverk som tillåter analytiker att sprida ut databearbetningar och modellträning på flera kluster och på så sätt möjliggör dataanalys och Machine Learning i stor skala.

Den här utbildningen introducerar er till Spark och R-paketet sparklyr, som gör det enkelt att interagera med Spark från R. Efter en introduktion till Spark går vi igenom Feature Engineering med Spark, d.v.s. hur vi bearbetar och modifierar data som gör våra modeller mer träffsäkra. Sedan går vi igenom Spark MLib och hur vi tränar, validerar och testar modeller. Till sist sparar vi våra modeller och resonerar kring hur vi kan implementera dessa i verksamheten. Utbildningen hålls av en eller två av Solitas erfarna Data-Science konsulter.

Vem riktar sig utbildningen till? Utbildningen riktar sig till analytiker eller Data Scientists som har erfarenhet av att programmera i R, motsvarande vår introduktionskurs R För Data Science.

Upplägg

Utbildning är en heldagsutbildning. Vi går igenom hur Spark är uppbyggt och hur vi använder R-paketet sparklyr för att träna, validera, testa och spara modeller.

  • Introduktion till Spark

  • Feature Engineering i Spark

  • Träna, validera och spara modeller med Spark MLib

Tele2
Det bästa med utbildningen i Spark och R var att den var praktisk och lösningsorienterad. Många delar lyfte vi in i våra prediktiva modeller samma dag som utbildningen tog slut.
Tele2

För mer information om utbildningen vänligen kontakta oss

Filip Wästberg

Data Science Consultant

[email protected]

+467 220 484 67

Vill du veta mer?
Fyll i dina uppgifter så kontaktar vi dig!