Seminare
Seminare

Data Analysis Bootcamp in R

Seminar - Essential Data Science Training GmbH

Der 5-tägige  Data Analysis Bootcamp in R vermittelt in einzeln buchbaren Modulen Grundkenntnisse in R (Modul 1), praktisches Wissen zur deskriptiven Datenanalyse, der statisischen Inferenz und Modellierung in R (Modul 2), sowie fortgeschrittene Kenntnisse zur effizienten Nutzung von R (Modul 3).

Ziel: Vermittlung von theoretischen Statistik-Kenntnissen sowie technischen und praktischen Wissen in R. Dies soll es den Teilnehmern erleichtern, in ihrem Arbeitsalltag eigene Analysen und Projekte zielgerichteter und effizienter bearbeiten zu können, ohne sich tagelang selber in bestimmte Themen einarbeiten zu müssen. Zudem werden in den einzelnen Themenblöcken hilfreiche Zusatzpakete in R empfohlen, deren Nutzung oft unnötige Programmierarbeit, zusätzliche Recherchen und Anfängerfehler ersparen können.

Termin Ort Preis*
07.10.2024- 11.10.2024 online 2.380,00
07.10.2024- 11.10.2024 München 3.326,05
auf Anfrage online auf Anfrage
auf Anfrage auf Anfrage auf Anfrage

Alle Termine anzeigen

*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Modul 1: R Crashkurs (1-tägig)

In diesem Tag werden Grundkenntnisse der Programmiersprache R vermittelt. Der Fokus liegt dabei auf die technische Einführung in R, das Erlernen der grundlegenden R-Syntax und das Arbeiten mit R zur Datenanalyse. Dieser Kurs ist sowohl für Teilnehmer ohne R Kenntnisse als auch zur Auffrischung der Grundlagen in geeignet. 

Themenschwerpunkte:

  • Arbeiten mit R und R Studio, eine der beliebtesten und mächtigsten graphischen Benutzeroberfläche (GUIs) für R.

  • Installation und Nutzung von Erweiterungspaketen in R.

  • Einführung in Hilfeseiten und Tipps zur Selbsthilfe.

  • Erläuterung der wichtigsten Datentypen, Operatoren (arithmetische und logische Operatoren) und Funktionen in R.

  • Import und Export von Daten (z.B. Dateiformate wie CSV, Excel etc.)

  • Arbeiten mit Dataframes und Vektoren (numeric, logical, character, factors), z.B. das Indizieren, Aufteilen und Umwandeln von Variablen bzw. Datensätzen.

  • Berechnen von einfachen statistischen Kennzahlen in R (z.B.: Median, Mittelwert, Quantile, Varianz, etc.).

Voraussetzungen: keine


Modul 2: Praktische Datenanalyse in R (2-tägig)

Kursteilnehmer sollen mit den wichtigsten Konzepten und Begriffen in Data Science, Statistik und der Datenanalyse vertraut gemacht werden und lernen erste explorative Analysen in verschiedenen Datensituationen durchzuführen. 

Themenschwerpunkte Teil 1: Grundlagen der Statistik und Datenanalyse in R

  • Definition von Data Science und weiterer Grundbegriffe

  • Einführung in ggplot2 zur Visualisierung von Daten

  • Univariate Deskriptive Statistik und Datenvisualisierung in R: Häufigkeitstabellen, Balkendiagramme, Histogramme, Kerndichteschätzung, Boxplots, Dichten und Verteilungen, QQ-Plots, etc.

  • Multivariate Deskriptive Statistik und Datenvisualisierung in R: Kreuztabellen, Scatter-Plots, Korrelation

Themenschwerpunkte Teil 2: Statistische Inferenz und Modellierung in R

  • Einführung in die statistische Inferenz: Punktschätzung, Intervallschätzung und Konfidenzintervalle

  • Statistische Hypothesentests: 

    • Motivation und Übersicht: Einstichproben vs. zweistichproben Test, einseitiger vs. zweiseitiger Test, gepaarter vs. ungepaarter Tests

    • Interpretation der Ergebnisse und Begriffserklärung: Signifikanzniveau, p-Wert, Teststatistik, etc.

    • Behandelte Tests: t-Test, Welch-Test (Test auf Mittelwertunterschiede), Mann-Whitney-U-Test bzw. Wilcoxon-Rangsummentest,  Shapiro-Wilk-Test (Test auf Normalverteilung), Kolmogoroff-Smirnow-Test (Test auf beliebige Verteilungen)

    • Multiples Testen: Probleme und Lösungsansätze (z.B. Bonferroni Korrektur)

  • Statistische Modellierung:

    • Das lineare Regressionsmodell mit Erweiterungen wie multipler Regression und Verwendung von kategorischen Einflussgrößen.

    • Modellevaluation und Modelldiagnose: MSE, R-squared, QQ-plots und Residuenanalyse

    • Ausblick: Generalisierte lineare Modelle (engl. generalized linear models) mit Fokus auf logistische Regression

Voraussetzungen: Kenntnisse in R (etwa im Umfang von Modul 1)


Modul 3: Effiziente Datenverarbeitung und Programmierung in R (2 Tage)

Lerne, wie du Daten in R effizient verarbeitest und programmierst, um Zeit bei statistischen Analysen zu sparen. Dieser Kurs vermittelt Fähigkeiten, um auch mit großen Datensätzen klarzukommen und Datenvorverarbeitung schneller durchzuführen.

Inhalt:

  • Effiziente Datenverarbeitung mit wichtigen R-Paketen
  • Schnelle Datenmanipulation und Split / Apply / Combine Operationen mit den Paketen dplyr und tidyverse
  • Kurzer Ausblick zu Datenbanken und SQL Anfragen direkt in R
  • Automatisierte Berichterstellung mit Markdown und dem knitr Paket
  • Fortgeschrittene R-Programmierung: Kontrollstrukturen, Schleifen, Objektorientierte Programmierung mit S3 und R6, Debugging, Exception und Error Handling
  • Effiziente Datenverarbeitung mit data.table und purrr
  • Parallelisierung von R-Code

Voraussetzungen:

  • Grundkenntnisse in R und Datenanalyse
  • Grundverständnis in der Statistik
  • SQL-Kenntnisse von Vorteil, aber nicht erforderlich
Technische Voraussetzungen:

Allgemeine Kursinformationen:

Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha