Seminare
Seminare

Data Science mit R

Webinar - PROKODA GmbH

Data Science mit R
Termin Ort Preis*
03.02.2025- 05.02.2025 online 2.249,10 €
09.04.2025- 11.04.2025 Düsseldorf 2.249,10 €
26.05.2025- 28.05.2025 online 2.249,10 €
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Grundlagen von R:

  • R und RStudio kennenlernen
  • Unterschiede von R zu anderen Programmiersprachen verstehen
  • Datenüberblick verschaffen und erste Diagramme erstellen
  • Installation von Paketen und deren Laden

dplyr (tidyverse) - Grundlagen:

  • Tidyverse kennenlernen
  • Tibble als erweiterte Form von data.frames erkunden
  • Grundlegende Funktionen von dplyr zur Spaltenauswahl kennenlernen
  • Nutzung von select(), filter(), rename() und slice()

Datenmanipulation mit dplyr:

  • Zeilen mit arrange() sortieren
  • Neue Spalten mit mutate() berechnen
  • Statistiken mit summarise() erstellen
  • Verwendung des Pipe Operators %>%
  • Daten mit group_by() gruppieren
  • Umgang mit fehlenden Werten: drop_na() und replace_na()

Berechnung von Statistiken mit dplyr:

  • Wesentliche deskriptive Statistiken anwenden
  • Zufällige Stichproben ziehen
  • Berechnung von Korrelationen
  • Erstellung von Kontingenztabellen

Kontrollstrukturen:

  • Eigene Funktionen erstellen
  • Standardparameter für Funktionen festlegen
  • Anwendung von For-Schleifen
  • Implementierung von If-Else-Bedingungen

Datenvisualisierung mit ggplot2:

  • Konzept der Grammar of Graphics verstehen
  • Nutzung von ggplot2-Layern zur Diagrammerstellung und statistischen Visualisierung
  • Variabilität oder Festsetzung von Darstellungen (Punktgröße, Farbe, Gruppierung) mithilfe einer Variable
  • Erstellung mehrerer Subplots, Anpassung und Speicherung von Diagrammen

Daten einlesen und schreiben:

  • Arbeitsverzeichnis in R und RStudio festlegen
  • Einlesen und Schreiben von CSV-, Excel- und SPSS-Dateien
  • Überblick über nützliche Parameter
  • Verwendung der fread()-Funktion für große Datensätze

Machine Learning:

  • Einführung
  • Anwendungsbeispiele von Machine Learning kennenlernen
  • Unterscheidung zwischen Künstlicher Intelligenz, Machine Learning und Deep Learning
  • Unterschiede zwischen überwachtem und unüberwachtem Lernen verstehen
  • Überfitting, Train-Test-Split und Kreuzvalidierung kennenlernen

Lineare Regression:

  • Daten in Test- und Trainingsdaten aufteilen, Modell erstellen und validieren
  • Grundlagen der linearen Regression verstehen
  • Umsetzung der linearen Regression in R
  • Ergebnisse validieren, z. B. durch die mittlere quadratische Abweichung (mean squared error)

Entscheidungsbaum in R:

  • Daten in Test- und Trainingsdaten aufteilen, Modell erstellen und validieren
  • Grundlagen von Entscheidungsbäumen verstehen
  • Umsetzung eines Entscheidungsbaums in R
  • Ergebnisse validieren, u. a. durch Verwendung der Verwirrungsmatrix, Sensitivität und Genauigkeit
  • Anpassung von Hyperparametern während des Trainings

Weitere Machine Learning-Algorithmen in R:

  • Überblick über Random Forest und K-means erhalten
  • Umsetzung der Algorithmen in R kennenlernen
  • Ergebnisse der Algorithmen validieren und interpretieren
Zielgruppe:
ZielgruppeDieses Seminar richtet sich an Fachleute, die in ihrem Unternehmen in den Bereichen Data Science, Datenanalyse mit R oder verwandten Bereichen wie Machine Learning oder Data Analysis tätig sind oder sein werden. Es konzentriert sich auf den Einsatz von Machine Learning-Algorithmen.VoraussetzungenDie Teilnahme am Data Science in R Kurs erfordert keine vorherigen Kenntnisse in R. Es ist jedoch wichtig, grundlegende Programmierkenntnisse in einer anderen Sprache zu haben, da wir in R Variablen erstellen, Werte zuweisen und eigene Funktionen oder for-Schleifen schreiben.

Statistische Grundlagen sind ebenfalls erforderlich. Teilnehmer sollten mit Begriffen wie Mittelwert, Standardabweichung, Median und Normalverteilung vertraut sein. Kenntnisse über das Summenzeichen, das Integral und mathematische Funktionen sind ebenfalls hilfreich. Es ist auch wichtig, die drei logischen Operatoren UND, ODER und NICHT zu kennen.

Da wir Daten mit R analysieren, sollten die Teilnehmer bereits mit der Arbeit mit Daten in Excel oder einer BI-Software vertraut sein, da wir beispielsweise spaltenweise einfache Statistiken wie den Mittelwert oder die Varianz berechnen.

Die Dokumentation und weitere Ressourcen zu R sind hauptsächlich in englischer Sprache verfügbar. Daher werden die Folien dieses Kurses auf Englisch sein. Das Seminar selbst wird jedoch auf Deutsch abgehalten.
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha