Python Pandas: Die Eigenschaft iloc[]
Die Python-Pandas-DataFrame-Eigenschaft iloc[] dient dazu, Daten innerhalb eines Pandas-DataFrames basierend auf ihrem Index auszuwählen. So können spezifische Zeilen und Spalten eines DataFrames anhand ihrer Position betrachtet werden.
- Flexibel: Hosting, das jedem Website-Traffic standhält
- Verlässlich: Inklusive 24/7-Support und persönlicher Beratung
- Sicher: Kostenloses SSL-Zertifikat, DDoS-Schutz und Backups
Syntax von Pandas iloc[]
Pandas iloc[] nimmt Integer entgegen, die spezifizieren, welche Elemente aus dem DataFrame ausgewählt werden sollen. Die allgemeine Syntax für die Pandas DataFrame.iloc() lautet:
DataFrame.iloc[selection]Sie können Pandas iloc[] einen einzigen Integer, eine Python-Liste von Integern, ein Slice-Objekt oder ein Tupel mit Zeilen- und Spaltenindizes übergeben.
Anwendung der DataFrame.iloc[]-Eigenschaft
Das Verhalten von Pandas iloc[] unterscheidet sich, je nachdem, was Sie der Eigenschaft für einen Wert übergeben. Praxisbeispiele helfen bei der Veranschaulichung.
Auswahl einer spezifischen Zeile
Zunächst wird ein DataFrame mit verschiedenen Personen, deren Alter sowie deren Wohnort erstellt:
import pandas as pd
# Beispiel-DataFrame erstellen
data = {'Name': ['Anna', 'Bob', 'Charlie', 'David'],
    'Alter': [28, 24, 22, 32],
    'Stadt': ['Berlin', 'München', 'Hamburg', 'Köln']}
df = pd.DataFrame(data)
print(df)Der resultierende DataFrame sieht wie folgt aus:
Name  Alter    Stadt
0     Anna     28   Berlin
1    Bob     24  München
2  Charlie     22  Hamburg
3    David     32     KölnMithilfe von iloc[] kann man nun eine beliebige Zeile auswählen, indem man den gewünschten Zeilenindex übergibt:
# Auswahl der nullten Zeile
result = df.iloc[0]
print(result)In diesem Beispiel wird die nullte Zeile (0) ausgewählt. Das Ergebnis sind die Daten für Anna:
Name       Anna
Alter        28
Stadt    Berlin
Name: 0, dtype: objectAuswahl einer spezifischen Zeile und Spalte
Möchten Sie nicht nur den Zeilen-, sondern auch den Spaltenindex angeben, übergeben Sie iloc[] diese Werte einfach durch ein Komma getrennt:
# Auswahl der nullten Zeile und ersten Spalte
result = df.iloc[0, 1]
print(result)Mit dem obigen Aufruf von Pandas iloc[] wird die nullte Zeile (0) und die erste Spalte (1) ausgewählt. Das Ergebnis ist daher das Alter von Anna: 28.
Auswahl mehrerer Zeilen und Spalten mithilfe von Slices
Sie können auch mehrere Zeilen und Spalten gleichzeitig auswählen, indem Sie Python Slices verwenden. Beachten Sie, dass der Index hinter dem Doppelpunkt in der Auswahl nicht berücksichtigt wird.
# Auswahl der ersten beiden Zeilen und der ersten beiden Spalten
result = df.iloc[0:2, 0:2]
print(result)Die Ausgabe des obigen Codes lautet:
Name  Alter
0    Anna    28
1    Bob    24Hier werden die ersten beiden Zeilen (0:2) und die ersten beiden Spalten (0:2) ausgewählt. Der resultierende DataFrame enthält nur die entsprechenden Ausschnitte.
Auswahl spezifischer Zeilen und Spalten mit Listen
Mehrere Spalten und Zeilen kann man auch mithilfe von Python-Listen auswählen. Diese haben den Vorteil, dass auch die Auswahl nicht zusammenhängender Bereiche des DataFrames funktioniert:
# Auswahl der nullten und zweiten Zeile sowie der ersten und zweiten Spalte
result = df.iloc[[0, 2], [1, 2]]
print(result)Hier werden die nullte und die zweite Zeile ([0, 2]) sowie die erste und die zweite Spalte ([1, 2]) ausgewählt, was zu folgendem Output führt:
Alter     Stadt
0      28    Berlin
2      22  Hamburg