Das Seminar zielt darauf ab, Unternehmen zu befähigen, ihre internen Datenanalysefähigkeiten zu stärken. Mit der Unterstützung von der statistischen Programmiersprache R und ChatGPT (inkl. dem „Advanced Data Analysis“ Feature) werden Mitarbeitende in die Lage versetzt, Daten effizient zu analysieren und wertvolle Erkenntnisse zu gewinnen. Dies fördert die Unabhängigkeit von externen Ressourcen, führt zu Kosteneinsparungen und beschleunigt Entscheidungsprozesse.
ChatGPT dient als zusätzliches Werkzeug, das praktische Hilfe und tiefere Einblicke in Datenanalysekonzepte bietet, wodurch die Effektivität der Schulung und die Anwendung der erlernten Fähigkeiten in realen Unternehmensszenarien verbessert wird.
Datenimport und -export mit dem tidyverse Paket: :
Datenimport aus verschiedenen Quellen (CSV, Excel, Datenbanken)
Überprüfung der Datenstruktur und des -formats
Datenexport in unterschiedlichen Formaten (CSV, Rdata, Excel)
Zusätzliche Unterstützung durch ChatGPT :
Erklärungen und Codebeispiele
Fehlerbehebung
Beratung zu Best Practices
Datenbereinigung und -manipulation mit ChatGPT-Unterstützung :
Umstrukturierung von Daten mit dplyr: Filtern, Sortieren, Gruppieren
Behandlung von fehlenden Werten: Imputationstechniken, Entfernen von Datensätzen
Zusätzliche Unterstützung durch ChatGPT :
Anleitung zu spezifischen Funktionen
Hilfe bei komplexen Datenmanipulationsaufgaben
Tipps zur Effizienzsteigerung
Statistische Analyse mit ChatGPT-Unterstützung :
Durchführung deskriptiver Statistiken mit dplyr: Mittelwerte, Standardabweichungen, Quartile
Korrelationsanalyse: Pearson- und Spearman-Korrelation
Erstellen von Kreuztabellen
Zusätzliche Unterstützung durch ChatGPT :
Erklärung statistischer Konzepte
Hilfe bei der Durchführung statistischer Tests
Interpretation von Ergebnissen
Datenvisualisierung mit ChatGPT-Unterstützung :
Grundlagen der Datenvisualisierung mit ggplot2: Balkendiagramme, Liniendiagramme
Fortgeschrittene Visualisierungen mit ggplot2: Streudiagramme, Boxplots, Heatmaps
Zusätzliche Unterstützung durch ChatGPT :
Komplexere Anpassungen der Visualisierungen
Tipps zur Verbesserung der Visualisierungen
Datenmodellierung :
Grundlagen und Begriffe des maschinellen Lernens
Erkennen und Vermeiden von Overfitting
Aufteilung der Daten in Trainings- und Testsets
Entscheidungsbaum
Einführung in die Entscheidungsbaummodellierung mit dem rpart-Paket
Anpassen von Hyperparametern und Modellvalidierung
Einführung in die Gütekriterien für die Klassifikation
Performance-Evaluation von Modellen
Dauer/zeitlicher Ablauf:
3 Tage
Zielgruppe:
Das Seminar zur Datenanalyse mit R richtet sich an Mitarbeiter verschiedener Bereiche und Positionen in Unternehmen, einschließlich Datenanalysten, Geschäfts- und Datenmanager, Forschungs- und Entwicklungsmitarbeiter, Marketing- und Vertriebsmitarbeiter, Finanzanalysten sowie IT- und Datenbankadministratoren.
Es ist für Anfänger geeignet, die grundlegende Datenanalysefähigkeiten in R entwickeln möchten, aber bereits über Grundlagen in einer anderen Programmiersprache verfügen, ebenso wie für fortgeschrittene Benutzer, die ihre Kenntnisse in R, tidyverse bzw. Machine Learning erweitern möchten.
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern.
Diese Cookies werden nicht automatisiert gesetzt.
Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren.
Weitere Informationen finden Sie hier.