Median berechnen
In der Statistik haben große Datenmengen meist nur dann eine Aussagekraft, wenn sie nach ihrer Erhebung entsprechend aufbereitet und analysiert werden. Dabei ist die Berechnung des Medians ein wichtiger Teil des Vorgehens. Denn wenn Sie den Median berechnen, reduzieren Sie Ihre Daten auf eine oder wenige Maßzahlen, sodass sich komplexe Zusammenhänge oder Sachverhalte in Form von Tabellen und Diagrammen übersichtlich darstellen lassen. Wir erklären Ihnen Schritt für Schritt, wie Sie den Median berechnen und interpretieren.
Was ist der Median?
Der Median, auch Zentralwert genannt, kommt aus der Statistik und ist bei mehreren Messungen der Wert, der genau in der Mitte steht, wenn Sie Ihre Daten der Größe nach sortieren. In der deskriptiven Statistik wird der Median auch als Lageparameter bezeichnet und dafür genutzt, die zentrale Tendenz des Datensatzes auszudrücken.
Der Median ist nicht zu verwechseln mit dem Durchschnittswert oder Mittelwert. Dieser wird nämlich berechnet, indem Sie alle Werte summieren und durch die Anzahl der Werte dividieren. Beim Median konzentrieren Sie sich auf den Wert, der sich in der aufsteigenden Reihenfolge in der Mitte befindet.
Mit welcher Formel berechnet man den Median?
Bei der Berechnung des Medians einer Datenreihe gibt es zwei Formeln, die Sie je nach der Anzahl der Beobachtungswerte verwenden. Das allgemeine Symbol für Median ist ˜x (sprich: „x Schlange“ oder „x Tilde“), n steht für die Anzahl der Beobachtungswerte und x steht für einen Wert aus der Datenreihe.
Liegt Ihnen eine ungerade Anzahl von Beobachtungswerten vor, nehmen Sie diese Formel:
Liegt Ihnen eine ungerade Anzahl von Beobachtungswerten vor, nehmen Sie diese Formel:
Liegt Ihnen hingegen eine gerade Anzahl von Beobachtungswerten vor, verwenden Sie diese Formel:
Im Folgenden erklären wir beide Fälle anhand von zwei einfachen Beispielen.
Median berechnen: So geht’s
Beispiel 1: Ungerade Anzahl von Werten
In unserem ersten Beispiel liegt Ihnen eine ungerade Anzahl von Beobachtungswerten vor. Stellen Sie ich vor, elf Teilnehmer eines Fortbildungsseminars werden nach ihrem Alter gefragt und die Antworten der Kursteilnehmer lauten wie folgt:
28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49
Sortieren Sie im ersten Schritt die Antworten in aufsteigender Reihenfolge:
19, 26, 28, 29, 34, 38, 43, 45, 49, 51, 62
Jeder der angegebenen Werte steht nun für einen bestimmten -Wert. Das heißt, 19 = x1 , 26 = x2 , 28 = x3 usw. Der Vorteil einer ungeraden Anzahl von Beobachtungswerten ist, dass Sie den Median nun direkt ablesen können. In diesem Fall ist er x6 = 38, da dieser Wert die Zahlenreihe in zwei Hälften teilt. Dabei ist eine Hälfte der Altersangaben (19, 26, 28, 29, 34) kleiner als der Median und die andere Hälfte der Altersangaben (43, 45, 49, 51, 62) größer als der Median.
Sie können den Median auch berechnen, indem Sie die Formel aus dem vorherigen Abschnitt anwenden. n steht dabei für die Anzahl der Beobachtungswerte, hier also 11. Die Formel lautet wie folgt:
28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49
Sortieren Sie im ersten Schritt die Antworten in aufsteigender Reihenfolge:
19, 26, 28, 29, 34, 38, 43, 45, 49, 51, 62
Jeder der angegebenen Werte steht nun für einen bestimmten -Wert. Das heißt, 19 = x1 , 26 = x2 , 28 = x3 usw. Der Vorteil einer ungeraden Anzahl von Beobachtungswerten ist, dass Sie den Median nun direkt ablesen können. In diesem Fall ist er x6 = 38, da dieser Wert die Zahlenreihe in zwei Hälften teilt. Dabei ist eine Hälfte der Altersangaben (19, 26, 28, 29, 34) kleiner als der Median und die andere Hälfte der Altersangaben (43, 45, 49, 51, 62) größer als der Median.
Sie können den Median auch berechnen, indem Sie die Formel aus dem vorherigen Abschnitt anwenden. n steht dabei für die Anzahl der Beobachtungswerte, hier also 11. Die Formel lautet wie folgt:
Da x6 für 38 steht, kommen wir also auf dasselbe Ergebnis. Der Median der erhobenen Altersangaben im Seminar ist 38, da dieser Wert genau in der Mitte liegt, wenn Sie die Daten der Größe nach anordnen.
Beispiel 2: Gerade Anzahl von Werten
In diesem Beispiel lässt sich der Median nicht so einfach ablesen, da die Anzahl der Beobachtungswerte gerade ist und sich der Median nicht an zentraler Stelle in der Datenreihe befindet.
Stellen Sie sich vor, dass im nächsten Fortbildungsseminar ein Teilnehmer hinzustößt, nun also zwölf Personen nach Ihrem Alter befragt werden. Die Antworten lauten wie folgt:
28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33
Ordnen Sie die Angaben nun wieder von klein nach groß in einer Datenreihe an und benennen Sie die Zahlen von x1 bis x12.
19, 26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62
Mit n = 12 kommt nun die Formel für gerade Beobachtungswerte zum Einsatz:
Stellen Sie sich vor, dass im nächsten Fortbildungsseminar ein Teilnehmer hinzustößt, nun also zwölf Personen nach Ihrem Alter befragt werden. Die Antworten lauten wie folgt:
28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33
Ordnen Sie die Angaben nun wieder von klein nach groß in einer Datenreihe an und benennen Sie die Zahlen von x1 bis x12.
19, 26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62
Mit n = 12 kommt nun die Formel für gerade Beobachtungswerte zum Einsatz:
Der Medianfür die erhobenen Altersangaben für dieses Seminar beträgt also 36.
Wenn Sie mit dem Tabellenkalkulationsprogramm Excel arbeiten, dann müssen Sie den Median nicht manuell berechnen. Excel bietet eine praktische Median-Funktion, die schnell und fehlerfrei das richtige Ergebnis auswirft.
Unterschied zu arithmetischem Mittel und Modus
Wie bereits erwähnt ist der Median nicht zu verwechseln mit dem Mittelwert oder Durchschnittswert. Dieser wird auch arithmetisches Mittel genannt und dann verwendet, wenn der durchschnittliche Wert einer Datenmenge herausgefunden werden soll. Für unser erstes Beispiel wäre das durchschnittliche Alter 38,5 (die Summe der Angaben dividiert mit der Anzahl der Teilnehmer). Außerdem gibt es noch den sogenannten Modus. Dieser Wert gibt an, welche die häufigste Angabe in einem Datensatz ist. In unseren Beispielen ist jede Antwort ein Modus, da jede von ihnen einzigartig ist.
Anwendung des Medians
Nun stellt sich die Frage, wann Sie den Median berechnen sollten und wann das arithmetische Mittel oder der Modus besser geeignet ist.
Dies kommt ganz auf die Situation an. Obwohl das arithmetische Mittel allgemein als präziser gilt und in der Statistik eine hohe Effizienz hat, reagiert es auch empfindlicher auf Ausreißer. Das heißt, dass eine falsche Messangabe im Datensatz den Durchschnittswert bereits erheblich verfälschen kann. Der Median ist zwar nicht so präzise oder effizient wie das arithmetische Mittel, gilt jedoch als robuster und wird deshalb gerne verwendet, wenn Datensätze verunreinigt sind.
Der Modus hingegen kommt zum Einsatz, wenn es sich nicht um numerische Werte, sondern um andere Merkmale handelt – Beispiel: Sie vertreiben ein Produkt in unterschiedlichen Farben und möchten herausfinden, welche Farbe die beliebteste ist.
Dies kommt ganz auf die Situation an. Obwohl das arithmetische Mittel allgemein als präziser gilt und in der Statistik eine hohe Effizienz hat, reagiert es auch empfindlicher auf Ausreißer. Das heißt, dass eine falsche Messangabe im Datensatz den Durchschnittswert bereits erheblich verfälschen kann. Der Median ist zwar nicht so präzise oder effizient wie das arithmetische Mittel, gilt jedoch als robuster und wird deshalb gerne verwendet, wenn Datensätze verunreinigt sind.
Der Modus hingegen kommt zum Einsatz, wenn es sich nicht um numerische Werte, sondern um andere Merkmale handelt – Beispiel: Sie vertreiben ein Produkt in unterschiedlichen Farben und möchten herausfinden, welche Farbe die beliebteste ist.