Die Python-Pandas-Funktion DataFrame.isna() hilft Ihnen dabei, fehlende Daten (NaN oder None) innerhalb eines Da­ta­Frames zu iden­ti­fi­zie­ren. Das kann hilfreich sein, um fest­zu­stel­len, ob geplante Analysen statt­fin­den können oder ob zuvor eine Be­rei­ni­gung der Daten notwendig ist.

Web­hos­ting
Das beste Web­hos­ting zum Spit­zen­preis
  • 3x schneller und 60 % günstiger
  • Maximale Ver­füg­bar­keit mit > 99.99 %
  • Nur bei IONOS: Bis zu 500 GB Spei­cher­platz inklusive

Syntax von Pandas isna()

Da Pandas isna() keine Parameter ent­ge­gen­nimmt, ist die Syntax der Funktion sehr einfach und sieht wie folgt aus:

DataFrame.isna()
python

Anwendung der isna()-Funktion

Pandas isna() wird auf einen DataFrame an­ge­wen­det, um einen neuen DataFrame mit boole­schen Werten zu erzeugen. Fehlt ein Wert im ur­sprüng­li­chen DataFrame bzw. ist NaN oder None, ist an der kor­re­spon­die­ren­den Stelle im Ergebnis der Wert True hin­ter­legt. An­de­ren­falls liefert isna() an der ent­spre­chen­den Stelle den Wert False.

Hinweis

Wenn Sie nicht nur iden­ti­fi­zie­ren wollen, ob NaN- oder None-Werte vorhanden sind, sondern diese auch entfernen möchten, lohnt sich ein Blick auf die Pandas-Funktion dropna(). Möchten Sie die Werte hingegen sys­te­ma­tisch ersetzen, kann die fillna()-Funktion aushelfen.

Iden­ti­fi­ka­ti­on fehlender Werte in einem DataFrame

In den folgenden Bei­spie­len wird ein DataFrame mit In­for­ma­tio­nen über ver­schie­de­ne Personen be­trach­tet, in dem jedoch einige Daten fehlen bzw. den Wert None haben:

import pandas as pd
# Beispiel-DataFrame erstellen
data = {
    'Name': ['Alice', 'Bob', None, 'David'],
    'Alter': [25, None, 35, 40],
    'Stadt': ['New York', 'Los Angeles', 'Chicago', None]
}
df = pd.DataFrame(data)
print(df)
python

Der DataFrame sieht fol­gen­der­ma­ßen aus:

Name  Alter        Stadt
0  Alice   25.0     New York
1    Bob    NaN  Los Angeles
2   None   35.0      Chicago
3  David   40.0         None

Um her­aus­zu­fin­den, welche Werte genau fehlen, kann isna() auf dem DataFrame auf­ge­ru­fen werden.

# Anwendung von Pandas isna()
missing_values = df.isna()
print(missing_values)
python

Der Funk­ti­ons­auf­ruf liefert einen neuen DataFrame, in dem ein Wert durch True ersetzt wird, wenn der ur­sprüng­li­che Wert fehlt, und durch False, wenn der Wert vorhanden ist. Das Ergebnis sieht daher wie folgt aus:

Name  Alter  Stadt
0  False  False  False
1  False   True  False
2   True  False  False
3  False  False   True

Zählen der fehlenden Werte pro Spalte

Es kann hilfreich sein, zu wissen, wie viele Werte in jeder Spalte fehlen, um zu ent­schei­den, wie man mit den fehlenden Daten umgeht. Hierzu kann isna() in Kom­bi­na­ti­on mit der Python-Funktion sum() genutzt werden.

# Zählen der fehlenden Werte pro Spalte
missing_count = df.isna().sum()
print(missing_count)
python

Das Resultat zeigt an, wie viele Werte in jeder Spalte fehlen:

Name     1
Alter    1
Stadt    1
dtype: int64
Zum Hauptmenü