Seminar - Essential Data Science Training GmbH
Kursteilnehmer sollen mit den wichtigsten Konzepten und Begriffen in Data Science, Statistik und der Datenanalyse vertraut gemacht werden und lernen erste explorative Analysen in verschiedenen Datensituationen durchzuführen.
Termin | Ort | Preis* |
---|---|---|
25.03.2025- 26.03.2025 | online | 476,00 € |
25.03.2025- 26.03.2025 | München | 476,00 € |
auf Anfrage | auf Anfrage | auf Anfrage |
Themenschwerpunkte Teil 1: Grundlagen der Statistik und Datenanalyse in R
Definition von Data Science und weiterer Grundbegriffe
Einführung in ggplot2 zur Visualisierung von Daten
Univariate Deskriptive Statistik und Datenvisualisierung in R: Häufigkeitstabellen, Balkendiagramme, Histogramme, Kerndichteschätzung, Boxplots, Dichten und Verteilungen, QQ-Plots, etc.
Multivariate Deskriptive Statistik und Datenvisualisierung in R: Kreuztabellen, Scatter-Plots, Korrelation
Themenschwerpunkte Teil 2: Statistische Inferenz und Modellierung in R
Einführung in die statistische Inferenz: Punktschätzung, Intervallschätzung und Konfidenzintervalle
Statistische Hypothesentests:
Motivation und Übersicht: Einstichproben vs. zweistichproben Test, einseitiger vs. zweiseitiger Test, gepaarter vs. ungepaarter Tests
Interpretation der Ergebnisse und Begriffserklärung: Signifikanzniveau, p-Wert, Teststatistik, etc.
Behandelte Tests: t-Test, Welch-Test (Test auf Mittelwertunterschiede), Mann-Whitney-U-Test bzw. Wilcoxon-Rangsummentest, Shapiro-Wilk-Test (Test auf Normalverteilung), Kolmogoroff-Smirnow-Test (Test auf beliebige Verteilungen)
Multiples Testen: Probleme und Lösungsansätze (z.B. Bonferroni Korrektur)
Statistische Modellierung:
Das lineare Regressionsmodell mit Erweiterungen wie multipler Regression und Verwendung von kategorischen Einflussgrößen.
Modellevaluation und Modelldiagnose: MSE, R-squared, QQ-plots und Residuenanalyse
Ausblick: Generalisierte lineare Modelle (engl. generalized linear models) mit Fokus auf logistische Regression
Voraussetzungen: Kenntnisse in R
Allgemeine Kursinformationen:
Kurssprache: Wenn nicht anders erwähnt Deutsch, Kursunterlagen: Englisch.
R Kurse: Sie benötigten R (ab Version 3.6.0: https://cran.r-project.org), RStudio (https://www.rstudio.com/products/rstudio) und ausreichend Berechtigungen um Zusatzpakete in R installieren zu können (z.B. mit dem Befehl install.packages).
Webinar-Tool: Zoom-Software, was mittels Breakout Sessions (virtuelle Kursräume) Gruppenarbeit und individuelle Betreuung ermöglicht. Eine Teilnahme ist auch ohne zusätzliche Installation der Zoom-Software möglich (siehe Zoom per Internetbrowser).