In der Statistik haben große Da­ten­men­gen meist nur dann eine Aus­sa­ge­kraft, wenn sie nach ihrer Erhebung ent­spre­chend auf­be­rei­tet und ana­ly­siert werden. Dabei ist die Be­rech­nung des Medians ein wichtiger Teil des Vorgehens. Denn wenn Sie den Median berechnen, re­du­zie­ren Sie Ihre Daten auf eine oder wenige Maßzahlen, sodass sich komplexe Zu­sam­men­hän­ge oder Sach­ver­hal­te in Form von Tabellen und Dia­gram­men über­sicht­lich dar­stel­len lassen. Wir erklären Ihnen Schritt für Schritt, wie Sie den Median berechnen und in­ter­pre­tie­ren.

Was ist der Median?

Der Median, auch Zen­tral­wert genannt, kommt aus der Statistik und ist bei mehreren Messungen der Wert, der genau in der Mitte steht, wenn Sie Ihre Daten der Größe nach sortieren. In der de­skrip­ti­ven Statistik wird der Median auch als La­ge­pa­ra­me­ter be­zeich­net und dafür genutzt, die zentrale Tendenz des Da­ten­sat­zes aus­zu­drü­cken.

Hinweis

Der Median ist nicht zu ver­wech­seln mit dem Durch­schnitts­wert oder Mit­tel­wert. Dieser wird nämlich berechnet, indem Sie alle Werte summieren und durch die Anzahl der Werte di­vi­die­ren. Beim Median kon­zen­trie­ren Sie sich auf den Wert, der sich in der auf­stei­gen­den Rei­hen­fol­ge in der Mitte befindet.

Mit welcher Formel berechnet man den Median?

Bei der Be­rech­nung des Medians einer Da­ten­rei­he gibt es zwei Formeln, die Sie je nach der Anzahl der Be­ob­ach­tungs­wer­te verwenden. Das all­ge­mei­ne Symbol für Median ist ˜x (sprich: „x Schlange“ oder „x Tilde“), n steht für die Anzahl der Be­ob­ach­tungs­wer­te und x steht für einen Wert aus der Da­ten­rei­he.

Liegt Ihnen eine ungerade Anzahl von Be­ob­ach­tungs­wer­ten vor, nehmen Sie diese Formel:

Liegt Ihnen hingegen eine gerade Anzahl von Be­ob­ach­tungs­wer­ten vor, verwenden Sie diese Formel:

Im Folgenden erklären wir beide Fälle anhand von zwei einfachen Bei­spie­len.

Median berechnen: So geht’s

Beispiel 1: Ungerade Anzahl von Werten

In unserem ersten Beispiel liegt Ihnen eine ungerade Anzahl von Be­ob­ach­tungs­wer­ten vor. Stellen Sie ich vor, elf Teil­neh­mer eines Fort­bil­dungs­se­mi­nars werden nach ihrem Alter gefragt und die Antworten der Kurs­teil­neh­mer lauten wie folgt:

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49

Sortieren Sie im ersten Schritt die Antworten in auf­stei­gen­der Rei­hen­fol­ge:

19, 26, 28, 29, 34, 38, 43, 45, 49, 51, 62

Jeder der an­ge­ge­be­nen Werte steht nun für einen be­stimm­ten -Wert. Das heißt, 19 = x1 , 26 = x2 , 28 = x3 usw. Der Vorteil einer ungeraden Anzahl von Be­ob­ach­tungs­wer­ten ist, dass Sie den Median nun direkt ablesen können. In diesem Fall ist er x6 = 38, da dieser Wert die Zah­len­rei­he in zwei Hälften teilt. Dabei ist eine Hälfte der Al­ters­an­ga­ben (19, 26, 28, 29, 34) kleiner als der Median und die andere Hälfte der Al­ters­an­ga­ben (43, 45, 49, 51, 62) größer als der Median.

Sie können den Median auch berechnen, indem Sie die Formel aus dem vor­he­ri­gen Abschnitt anwenden. n steht dabei für die Anzahl der Be­ob­ach­tungs­wer­te, hier also 11. Die Formel lautet wie folgt:

Da x6 für 38 steht, kommen wir also auf dasselbe Ergebnis. Der Median der erhobenen Al­ters­an­ga­ben im Seminar ist 38, da dieser Wert genau in der Mitte liegt, wenn Sie die Daten der Größe nach anordnen.

Beispiel 2: Gerade Anzahl von Werten

In diesem Beispiel lässt sich der Median nicht so einfach ablesen, da die Anzahl der Be­ob­ach­tungs­wer­te gerade ist und sich der Median nicht an zentraler Stelle in der Da­ten­rei­he befindet.

Stellen Sie sich vor, dass im nächsten Fort­bil­dungs­se­mi­nar ein Teil­neh­mer hin­zu­stößt, nun also zwölf Personen nach Ihrem Alter befragt werden. Die Antworten lauten wie folgt:

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33

Ordnen Sie die Angaben nun wieder von klein nach groß in einer Da­ten­rei­he an und benennen Sie die Zahlen von x1 bis x12.

19, 26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62

Mit n = 12 kommt nun die Formel für gerade Be­ob­ach­tungs­wer­te zum Einsatz:

Der Medianfür die erhobenen Al­ters­an­ga­ben für dieses Seminar beträgt also 36.

Hinweis

Wenn Sie mit dem Ta­bel­len­kal­ku­la­ti­ons­pro­gramm Excel arbeiten, dann müssen Sie den Median nicht manuell berechnen. Excel bietet eine prak­ti­sche Median-Funktion, die schnell und feh­ler­frei das richtige Ergebnis auswirft.

Un­ter­schied zu arith­me­ti­schem Mittel und Modus

Wie bereits erwähnt ist der Median nicht zu ver­wech­seln mit dem Mit­tel­wert oder Durch­schnitts­wert. Dieser wird auch arith­me­ti­sches Mittel genannt und dann verwendet, wenn der durch­schnitt­li­che Wert einer Da­ten­men­ge her­aus­ge­fun­den werden soll. Für unser erstes Beispiel wäre das durch­schnitt­li­che Alter 38,5 (die Summe der Angaben dividiert mit der Anzahl der Teil­neh­mer). Außerdem gibt es noch den so­ge­nann­ten Modus. Dieser Wert gibt an, welche die häufigste Angabe in einem Datensatz ist. In unseren Bei­spie­len ist jede Antwort ein Modus, da jede von ihnen ein­zig­ar­tig ist.

Anwendung des Medians

Nun stellt sich die Frage, wann Sie den Median berechnen sollten und wann das arith­me­ti­sche Mittel oder der Modus besser geeignet ist.

Dies kommt ganz auf die Situation an. Obwohl das arith­me­ti­sche Mittel allgemein als präziser gilt und in der Statistik eine hohe Effizienz hat, reagiert es auch emp­find­li­cher auf Ausreißer. Das heißt, dass eine falsche Mess­an­ga­be im Datensatz den Durch­schnitts­wert bereits erheblich ver­fäl­schen kann. Der Median ist zwar nicht so präzise oder effizient wie das arith­me­ti­sche Mittel, gilt jedoch als robuster und wird deshalb gerne verwendet, wenn Da­ten­sät­ze ver­un­rei­nigt sind.

Der Modus hingegen kommt zum Einsatz, wenn es sich nicht um nu­me­ri­sche Werte, sondern um andere Merkmale handelt – Beispiel: Sie ver­trei­ben ein Produkt in un­ter­schied­li­chen Farben und möchten her­aus­fin­den, welche Farbe die be­lieb­tes­te ist.

Zum Hauptmenü