Sie können bei Python Pandas Da­ta­Frames die unique()-Funktion nutzen, um die ein­deu­ti­gen Werte in einer Spalte eines Da­ta­Frames zu ermitteln. So können Sie sich effizient eine Übersicht der ver­schie­de­nen Werte innerhalb eines Da­ten­sat­zes ver­schaf­fen.

Web­hos­ting
Das beste Web­hos­ting zum Spit­zen­preis
  • 3x schneller und 60 % günstiger
  • Maximale Ver­füg­bar­keit mit > 99.99 %
  • Nur bei IONOS: Bis zu 500 GB Spei­cher­platz inklusive

Syntax von Pandas DataFrame[].unique()

Die grund­le­gen­de Syntax für die Anwendung von Pandas unique() ist einfach, denn die Funktion nimmt keinerlei Parameter entgegen:

DataFrame['column_name'].unique()
python

Beachten Sie, dass bei Pandas Da­ta­Frames unique() nur auf eine spe­zi­fi­sche Spalte des Da­ta­Frames an­ge­wen­det werden kann. Diese müssen Sie also zuvor spe­zi­fi­zie­ren. Die unique()-Funktion liefert Ihnen ein numpy-Array mit den ein­zig­ar­ti­gen Werten in der Rei­hen­fol­ge ihres Er­schei­nens zurück; eine Sor­tie­rung der Werte findet nicht statt.

Hinweis

Wenn Sie sich schon länger mit Python-Pro­gram­mie­rung be­schäf­ti­gen, kennen Sie sicher auch das numpy-Äqui­va­lent zu Pandas unique()-Funktion. Eine Anwendung der Pandas-Variante ist aus Ef­fi­zi­enz­grün­den vor­zu­zie­hen.

Anwendung von Pandas unique()

Auf Pandas Da­ta­Frames kann unique() dann genutzt werden, wenn Sie zuvor eine Spalte spe­zi­fi­zie­ren, in der nach ein­deu­ti­gen Werte gesucht werden soll.

Im folgenden Beispiel be­trach­ten wir einen DataFrame mit In­for­ma­tio­nen über ver­schie­de­ne Personen.

import pandas as pd
# Erstellen eines Beispiel-DataFrames
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Alter': [24, 27, 22, 32, 29],
    'Stadt': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
python

Der re­sul­tie­ren­de DataFrame sieht wie folgt aus:

Name  Alter      Stadt
0    Alice     24     New York
1    Bob     27  Los Angeles
2  Charlie     22     New York
3    David     32    Chicago
4   Edward     29  Los Angeles

Es sollen nun die Städte ermittelt werden, in denen diese Personen leben. Hierbei soll jede Stadt nur ein einziges Mal gelistet werden. Pandas unique()-Funktion wird hierzu auf der Spalte des Da­ta­Frames an­ge­wen­det, die die Städte enthält:

# Eindeutige Städte finden
unique_cities = df['Stadt'].unique()
print(unique_cities)
python

Die Ausgabe ist ein numpy-Array, der jede Stadt ein Mal enthält. Dies zeigt, dass die Personen aus drei ver­schie­de­nen Städten stammen: New York, Los Angeles und Chicago.

['New York' 'Los Angeles' 'Chicago']
Zum Hauptmenü