Die DataFrame.mean()-Funktion Python Pandas dient zur Be­rech­nung des Durch­schnitts­werts über eine oder mehrere Achsen eines Da­ta­Frames. Pandas mean() ist ent­schei­dend für die Analyse nu­me­ri­scher Daten und kann wertvolle Einblicke in deren Ver­tei­lung und Durch­schnitts­wer­te liefern.

Web­hos­ting
Das beste Web­hos­ting zum Spit­zen­preis
  • 3x schneller und 60 % günstiger
  • Maximale Ver­füg­bar­keit mit > 99.99 %
  • Nur bei IONOS: Bis zu 500 GB Spei­cher­platz inklusive

Syntax von Pandas DataFrame.mean()

Die Pandas-mean()-Funktion nimmt bis zu drei Parameter entgegen und folgt einer einfachen grund­le­gen­den Syntax:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)
python

Relevante Parameter

Mithilfe ver­schie­de­ner Parameter kann das Verhalten von Pandas DataFrame.mean() für Ihren in­di­vi­du­el­len An­wen­dungs­fall angepasst werden.

Parameter Be­schrei­bung Default-Wert
axis Bestimmt, ob die Be­rech­nung über Zeilen (axis=0) oder Spalten (axis=1) erfolgen soll 0
skipna Wenn True, werden NaN-Werte ignoriert True
numeric_only Wenn True, werden nur nu­me­ri­sche Da­ten­ty­pen in die Be­rech­nung ein­be­zo­gen False

Anwendung der Pandas mean()-Funktion

Pandas DataFrame.mean() kann auf ver­schie­de­ne Weise an­ge­wen­det werden.

Durch­schnitts­wer­te für jede Spalte berechnen

In den folgenden Code­bei­spie­len wird ein Pandas-DataFrame mit den folgenden Bei­spiel­da­ten be­trach­tet:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)
python

Der re­sul­tie­ren­de DataFrame ist der folgende:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

Um den Durch­schnitts­wert jeder Spalte zu berechnen, kann die Pandas-mean()-Funktion mit dem Stan­dard­pa­ra­me­ter axis=0 genutzt werden:

column_means = df.mean()
print(column_means)
python

Auf diese Weise werden die Mit­tel­wer­te jeder Spalte (A, B und C) berechnet, indem die Summe der Elemente durch die Anzahl der Elemente in jeder Spalte geteilt wird. Das Ergebnis ist folgende Pandas Series:

A    2.5
B    5.5
C    8.5
dtype: float64

Durch­schnitts­wer­te für jede Zeile berechnen

Wenn man statt­des­sen den Durch­schnitts­wert für jede Zeile berechnen möchte, muss hierzu einfach der Parameter axis auf 1 gesetzt werden:

row_means = df.mean(axis=1)
print(row_means)
python

Die Mit­tel­wer­te jeder Zeile werden durch den Einsatz von Pandas mean() berechnet, indem die Summe der Elemente durch die Anzahl der Elemente in jeder Zeile geteilt wird. Der Funk­ti­ons­auf­ruf liefert folgenden Output:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

NaN-Werte igno­rie­ren

Im folgenden Beispiel wird ein anderer DataFrame be­trach­tet, der einige NaN-Werte enthält:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)
python

Der obige Code re­sul­tiert in folgendem DataFrame:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Um den Durch­schnitt unter Be­rück­sich­ti­gung von NaN-Werten zu berechnen, wird der Parameter skipna verwendet. Der Stan­dard­wert ist True, was bedeutet, dass NaN-Werte von Pandas mean() au­to­ma­tisch ignoriert werden. Würde skipna=False gesetzt, würde der Mit­tel­wert für jede Spalte, die min­des­tens einen NaN-Wert enthält, ebenfalls NaN sein.

mean_with_nan = df.mean()
print(mean_with_nan)
python

Der Funk­ti­ons­auf­ruf von Pandas mean() liefert:

A    2.333333
B    5.666667
C    8.000000
dtype: float64
Zum Hauptmenü