R-Commands sind die Grundlage für die Da­ten­ana­ly­se und sta­tis­ti­sche Mo­del­lie­rung in der R-Umgebung. Sie bieten die Werkzeuge und die Fle­xi­bi­li­tät, um Daten zu verstehen, Muster zu erkennen und fundierte Ent­schei­dun­gen zu treffen.

Was sind R-Commands?

R-Commands sind An­wei­sun­gen oder Befehle, die in der R-Pro­gram­mie­rung an­ge­wen­det werden, um spe­zi­fi­sche Aufgaben aus­zu­füh­ren oder Aktionen in der R-Umgebung zu in­iti­ie­ren. Diese Befehle er­mög­li­chen es, Daten zu ana­ly­sie­ren, sta­tis­ti­sche Be­rech­nun­gen durch­zu­füh­ren oder Vi­sua­li­sie­run­gen zu erstellen. R-Commands können in der R Command Line oder in R-Skripten ein­ge­ge­ben und ver­ar­bei­tet werden. Es ist wichtig, Befehle von Funk­tio­nen in R zu un­ter­schei­den.

R-Funk­tio­nen sind in R de­fi­nier­te und benannte Code­blö­cke, die bestimmte Aufgaben erledigen. Diese können die Ver­wen­dung von R-Ope­ra­to­ren und R-Daten ein­schlie­ßen, um Argumente zu ak­zep­tie­ren oder Rück­ga­be­wer­te aus­zu­ge­ben. Dies bedeutet, dass Funk­tio­nen Daten speichern, ver­ar­bei­ten und zu­rück­ge­ben können, die mit ver­schie­de­nen R-Da­ten­ty­pen verknüpft sind.

Tipp

Mit Webspace von IONOS pro­fi­tie­ren Sie von min­des­tens 50 GB freien Speicher und leis­tungs­star­ken Servern mit hoher Ver­füg­bar­keit, die si­cher­stel­len, dass Ihre Website immer online ist und schnell geladen wird. Darüber hinaus erhalten Sie eine kos­ten­lo­se Domain und ein SSL-Wildcard-Zer­ti­fi­kat, um die Si­cher­heit Ihrer Website zu ge­währ­leis­ten.

R-Befehle in der Übersicht

Die nach­fol­gen­de R-Befehle-Liste soll Ihnen einen Überblick über die ver­schie­de­nen An­wen­dungs­be­rei­che in der R-Pro­gram­mie­rung geben. Je nach Ihren spe­zi­fi­schen An­for­de­run­gen und Projekten können Sie die ge­eig­ne­ten R-Commands auswählen und kom­bi­nie­ren.

Da­ten­ma­ni­pu­la­ti­on und -ver­ar­bei­tung

  • read.csv(): Einlesen von Daten aus einer CSV-Datei
  • data.frame(): zur Er­stel­lung eines Da­ten­rah­mens
  • subset(): Filtern von Daten basierend auf be­stimm­ten Be­din­gun­gen
  • merge(): Zu­sam­men­füh­ren von Daten aus ver­schie­de­nen Da­ten­rah­men
  • aggregate(): Agg­re­gie­rung von Daten basierend auf be­stimm­ten Kriterien
  • transform(): Erstellen neuer Variablen in einem Da­ten­rah­men
  • sort(): Sor­tie­rung von Vektoren oder Da­ten­rah­men
  • unique(): zur Iden­ti­fi­ka­ti­on ein­deu­ti­ger Werte in einem Vektor oder einer Spalte

Da­ten­vi­sua­li­sie­rung

  • plot(): Er­stel­lung von Streu­dia­gram­men und anderen Grund­dia­gramm­ty­pen
  • hist() : Er­stel­lung von His­to­gram­men
  • barplot(): Er­stel­lung von Bal­ken­dia­gram­men
  • boxplot(): Er­stel­lung von Boxplots
  • ggplot2::ggplot(): für an­spruchs­vol­le­re und an­pass­ba­re Vi­sua­li­sie­run­gen mit dem ggplot2-Paket

Sta­tis­ti­sche Analysen

  • summary(): Be­reit­stel­lung einer Zu­sam­men­fas­sung von Daten, ein­schließ­lich sta­tis­ti­scher Kenn­zah­len
  • lm(): Durch­füh­rung linearer Re­gres­sio­nen
  • t.test(): Durch­füh­ren von T-Tests für Hy­po­the­sen­tests
  • cor(): Be­rech­nung von Kor­re­la­ti­ons­ko­ef­fi­zi­en­ten zwischen Variablen
  • anova(): Durch­füh­rung von Analysen der Varianz (ANOVA)
  • chi-sq.test(): für Chi-Quadrat-Tests

Da­ten­ver­ar­bei­tung

  • ifelse(): für Be­din­gungs­aus­wer­tun­gen und bedingte Aus­drü­cken
  • apply(): Anwendung einer Funktion auf Matrizen oder Da­ten­rah­men
  • dplyr::filter(): Filterung von Daten in Da­ta­frames mit dem dplyr-Paket
  • dplyr::mutate(): Er­stel­lung neuer Variablen in Da­ta­frames mit dem dplyr-Paket
  • lapply(), sapply(), mapply(): zur Anwendung von Funk­tio­nen auf Listen oder Vektoren

Da­ten­im­port und -export

  • readRDS(), saveRDS(): Einlesen und Speichern von R-Da­ten­ob­jek­ten
  • write.csv(), read.table(): Ex­por­tie­ren und Im­por­tie­ren von Daten in ver­schie­de­nen Formaten

Sta­tis­ti­sche Grafiken und Diagramme

  • qqnorm(), qqline(): zur Er­stel­lung von Quantil-Quantil-Dia­gram­men
  • plot(), acf(): Dar­stel­lung von Au­to­kor­re­la­ti­ons­dia­gram­men
  • density(): Dar­stel­lung von Dich­te­funk­tio­nen und His­to­gram­men
  • heatmap(): Er­stel­lung von Heatmaps

Beispiele für den Einsatz von R-Commands

Die folgenden Code­bei­spie­le ver­an­schau­li­chen Ihnen die Ver­wen­dung der wich­tigs­ten R-Befehle in ver­schie­de­nen An­wen­dungs­be­rei­chen. Je nach Ihren Daten und Ana­ly­se­an­for­de­run­gen können Sie diese Befehle anpassen und erweitern.

Einlesen von Daten aus einer CSV-Datei

data <- read.csv("daten.csv")
R

Read.csv() ist ein Befehl zum Einlesen von Daten aus einer CSV-Datei in R. Die ein­ge­le­se­nen Daten werden in unserem Beispiel in der Variablen data ge­spei­chert. Dieser Befehl ist nützlich, um externe Daten in R zu im­por­tie­ren und für Analysen zur Verfügung zu stellen.

Erstellen eines Streu­dia­gramms

plot(data$X, data$Y, main="Streudiagramm")
R

Plot() gehört zu den R-Commands zur Er­stel­lung von Dia­gram­men und Grafiken in R. Hier wird ein Streu­dia­gramm ge­zeich­net, das die Beziehung zwischen den Variablen X und Y aus dem Da­ten­rah­men data darstellt. Das Argument main legt den Titel des Diagramms fest.

Durch­füh­ren einer linearen Re­gres­si­on

regression_model <- lm(Y ~ X, data=data)
R

Bei diesem Beispiel führen wir eine lineare Re­gres­si­on durch, um die Beziehung zwischen den Variablen X und Y aus dem Da­ten­rah­men data zu mo­del­lie­ren. Der Befehl lm() dient zur Be­rech­nung einer linearen Re­gres­si­on in R. Das Ergebnis der Re­gres­si­on wird in der Variablen regression_model ge­spei­chert und kann für weitere Analysen ein­ge­setzt werden.

Filtern von Daten mit dem dplyr-Paket

filtered_data <- dplyr::filter(data, column > 10)
R

Der Befehl dplyr::filter() stammt aus dem dplyr-Paket und wird zur Da­ten­ma­ni­pu­la­ti­on verwendet. Das dplyr-Paket bietet leis­tungs­fä­hi­ge Funk­tio­nen zur Da­ten­fil­te­rung. Wir erhalten die Variable filtered_data, indem Zeilen aus dem Da­ten­rah­men data aus­ge­wählt werden, bei denen der Wert in der Spalte column größer als 10 ist.

Erstellen von Quantil-Quantil-Dia­gram­men

qqnorm(data$Variable)
qqline(data$Variable)
R

Sie können qqnorm() zum Dar­stel­len eines Quantil-Quantil-Diagramms in R nutzen. In diesem Beispiel wird ein Quantil-Quantil-Diagramm für die Variable Variable aus data ge­zeich­net. qqline() fügt eine Re­fe­renz­li­nie hinzu, um die Ver­tei­lung mit einer Nor­mal­ver­tei­lung zu ver­glei­chen.

Für alle Anfänger und An­fän­ge­rin­nen empfehlen wir das Tutorial zum Einstieg in die R-Pro­gram­mie­rung. Darin erhalten Sie um­fang­rei­che Tipps und das nötige Ba­sis­wis­sen, um in die R-Pro­gram­mier­spra­che ein­zu­stei­gen. Weitere Tipps und Grund­la­gen finden Sie in unserem all­ge­mei­nen Ratgeber „Pro­gram­mie­ren lernen“ hier im Digital Guide.

Zum Hauptmenü