R ist mit über zwei Millionen Nutzern weltweit eine der meistverwendeten Programmiersprachen im data science. Als eine der de-facto data science Programmiersprachen (neben Python) bieten viele data science Software Anbieter Schnittstellen zu R an.
Die Teilnehmer lernen einen Überblick über den cross industry standard process for data minig und über verwendete Algorithmik, um data science Ergebnisse besser zu verstehen und kritisch zu hinterfragen.
Die Grundlagen der Programmiersprache R werden erlernt, so dass ein selbstständiges Arbeiten möglich ist. Die beschriebenen Inhalte werden vor allem mit den Paketen data.table, ggplot2, dplyr, foreign, lubridate umgesetzt.