Pandas iterrows(): So iterieren Sie über DataFrames

Inhaltsverzeichnis

Die Python-Pandas-Funktion DataFrame.iterrows() wird verwendet, um über die Zeilen eines Pandas DataFrames zu iterieren. Sie liefert für jede Zeile ein Python Tuple aus dem Index und einer Series, die die Daten der entsprechenden Zeile enthält.

Webhosting

Das beste Webhosting zum Spitzenpreis

3x schneller und 60 % günstiger
Maximale Verfügbarkeit mit > 99.99 %
Nur bei IONOS: Bis zu 500 GB Speicherplatz inklusive

Syntax von Pandas `iterrows()`

Die grundlegende Syntax von Pandas DataFrame.iterrows() ist einfach, denn die Funktion nimmt keinerlei Parameter entgegen:

df.iterrows()

python

Im obigen Codebeispiel bezeichnet df den DataFrame, über den iteriert werden soll.

Anwendung der Pandas-`iterrows()`-Funktion

Die Funktion DataFrame.iterrows() wird typischerweise immer dann angewendet, wenn Sie Daten zeilenweise verarbeiten müssen. Häufig wird sie daher mit Python-for-Loops kombiniert.

Summieren von Werten einer Spalte

Im Folgenden wird ein DataFrame mit den Spalten Name, Alter und Punktzahl betrachtet:

import pandas as pd
# Beispiel-DataFrame erstellen
data = {'Name': ['Anna', 'Ben', 'Clara'],
    'Alter': [23, 35, 29],
    'Punktzahl': [88, 92, 85]}
df = pd.DataFrame(data)
print(df)

python

Der obige Code resultiert in folgendem DataFrame:

Name  Alter  Punktzahl
0   Anna     23         88
1    Ben     35         92
2  Clara     29         85

Nun soll die Summe der Punktzahlen berechnet werden. Hierfür kann Pandas DataFrame.iterrows() genutzt werden:

# Summe der Punktzahlen berechnen
total_score = 0
for index, row in df.iterrows():
    total_score += row['Punktzahl']
print(f"Die Gesamtsumme der Punktzahlen beträgt: {total_score}")

python

In diesem Beispiel wird die Pandas-iterrows()-Funktion verwendet, um über die Zeilen zu iterieren und die Werte in der Spalte Punktzahl sukzessive zu summieren. Das Ergebnis sieht wie folgt aus:

Die Gesamtsumme der Punktzahlen beträgt: 265

Hinweis

Bei der Arbeit mit Pandas iterrows() sollten Sie darauf achten, die Daten, über die Sie iterieren, niemals direkt zu verändern. Dies führt je nach Datentyp nicht zum gewünschten Erfolg und kann in unvorhergesehenem Verhalten resultieren.

Bedingte Zeilenbearbeitung

Die iterrows()-Funktion kann auch genutzt werden, um Bedingungen auf einzelne Zeilen Ihres DataFrames anzuwenden. Stellen Sie sich vor, Sie möchten im bereits bekannten DataFrame die Namen aller Personen abrufen, die älter als 30 Jahre sind:

# Namen von Personen abrufen, die älter als 30 sind
names = []
for index, row in df.iterrows():
    if row['Alter'] > 30:
        names.append(row['Name'])
print(f"Personen älter als 30 Jahre: {names}")

python

Im Codebeispiel wird mithilfe von Pandas DataFrame.iterrows() durch die Zeilen des Datensatzes iteriert. Innerhalb der for-Schleife werden die Werte der Spalte Alter betrachtet, um nur die Namen der Personen in der Python-Liste names zu speichern, die älter als 30 Jahre sind. Hierfür wird die Python-append()-Funktion genutzt. Dieses Vorgehen führt zu folgendem Resultat:

Personen älter als 30 Jahre: ['Ben']

Hinweis

Obwohl Pandas DataFrames.iterrows() einfach anzuwenden ist, sollte sie aufgrund der potenziell niedrigeren Effizienz bei großen DataFrames mit Bedacht verwendet werden. In vielen Fällen gibt es performantere Alternativen wie apply() oder vektorisiertes Rechnen mit Pandas.

KI-Wissen für Ihren Erfolg

Unser Newsletter bringt Ihnen die wichtigsten Insights rund um KI – verständlich, praxisnah und auf den Punkt.

Python Pandas: Die Bibliothek für Datenanalyse und -manipulation

Mithilfe von Python Pandas lassen sich Datensätze einfach verarbeiten, manipulieren und analysieren. Das ist insbesondere für Datenanalysten und -analystinnen oder Forschende sehr hilfreich. Wir zeigen Ihnen, welche Vorteile die Nutzung der Pandas-Bibliothek bietet, und erklären…

Python
Python Pandas

ESB Professionalshutterstock

Pandas DataFrame: In Python Tabellen schnell und übersichtlich manipulieren!

Das Pandas-Modul ist eines der mächtigsten Werkzeuge zur Datenmanipulation in Python. Eine der zentralen Datenstrukturen in Pandas ist der DataFrame. Mit DataFrames kann man zweidimensionale, strukturierte Daten effizient und übersichtlich manipulieren. Wir erklären Ihnen anhand…

Python Pandas

Mr. Kosalshutterstock

Python Pandas any() im Überblick

Die Methode Pandas DataFrame any() ist ein effizientes Werkzeug, um schnell zu prüfen, ob in einer bestimmten Achse eines DataFrames mindestens ein True-Wert vorhanden ist. Sie ist besonders hilfreich bei der Analyse und Validierung von Daten. Wir zeigen Ihnen, wie Sie die…

Python Pandas

UndreyShutterstock

Python Pandas: Die Eigenschaft iloc[]

Bei der Arbeit mit DataFrames in Python Pandas kann es vorkommen, dass nicht alle Zeilen oder Spalten eines DataFrames für die Datenanalyse relevant sind. Die Pandas-DataFrame-Eigenschaft iloc[] ist daher ein nützliches Werkzeug, um die gewünschten Zeile oder Spalten anhand ihrer…

Python Pandas

REDPIXEL.PLShutterstock

Pandas mean(): Durchschnittswerte einfach errechnen

Pandas DataFrame.mean() ist eine Funktion zur Berechnung von Durchschnittswerten in einem DataFrame. Sie bietet Flexibilität bei der Handhabung von NaN-Werten und ermöglicht es, sowohl über Zeilen als auch über Spalten Mittelwerte zu berechnen. In diesem Artikel erfahren Sie,…

Python Pandas

UndreyShutterstock

Python Pandas: DataFrames mit merge() verbinden

Die Pandas DataFrame-merge()-Methode bietet Programmiererinnen und Programmierern verschiedene Möglichkeiten, Daten aus unterschiedlichen Quellen zu kombinieren. Durch die Verwendung der Parameter können Benutzende unterschiedliche Arten von Join-Operationen durchführen, um ihre…

Python Pandas

Pandas iterrows(): So iterieren Sie über Da­ta­Frames

Syntax von Pandas iterrows()

Anwendung der Pandas-iterrows()-Funktion

Summieren von Werten einer Spalte

Bedingte Zei­len­be­ar­bei­tung

Pandas iterrows(): So iterieren Sie über DataFrames

Syntax von Pandas `iterrows()`

Anwendung der Pandas-`iterrows()`-Funktion

Bedingte Zeilenbearbeitung