Замена пропущенных значений с помощью функции fillna
Метод fillna в языке программирования Python
Метод fillna в языке программирования Python используется для замены отсутствующих значений (NaN) в структурах данных, таких как массивы, списки, серии или фреймы данных. Он предоставляет возможность заполнить пропущенные значения определенными значениями или применить различные стратегии интерполяции для их замены.
Часто в реальном мире данные содержат пропущенные значения, которые могут возникать из разных причин, таких как ошибки ввода, потеря данных, ошибки обработки и т.д. Пропущенные значения могут вызвать проблемы при анализе данных и моделировании, поэтому fillna является очень полезной функцией для их обработки.
Примеры использования fillna:
Пример 1: Заполнение пропущенных значений в списке
import pandas as pd
import numpy as np
data = [1, 2, np.nan, 4, np.nan, 6, 7, np.nan, 9]
df = pd.DataFrame(data, columns=['Value'])
print("Исходный список:")
print(df)
# Заполнение пропущенных значений с помощью числа 0
df['Value'].fillna(0, inplace=True)
print("Заполнение значениями 0:")
print(df)
Пример 2: Заполнение пропущенных значений в фрейме данных
import pandas as pd
import numpy as np
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
'Age': [25, np.nan, 37, 29],
'Salary': [50000, np.nan, 75000, np.nan]}
df = pd.DataFrame(data)
print("Исходный фрейм данных:")
print(df)
# Заполнение пропущенных значений средним значением столбца
df['Age'].fillna(df['Age'].mean(), inplace=True)
# Заполнение пропущенных значений медианой столбца
df['Salary'].fillna(df['Salary'].median(), inplace=True)
print("Заполнение средним значением и медианой:")
print(df)
Пример 3: Сложные стратегии заполнения пропущенных значений
import pandas as pd
import numpy as np
data = [1, np.nan, np.nan, 4, 5, np.nan, 7, 8, np.nan]
df = pd.DataFrame(data, columns=['Value'])
print("Исходный список:")
print(df)
# Заполнение пропущенных значений прямым заполнением
df['Value'].fillna(method='ffill', inplace=True)
print("Прямое заполнение:")
print(df)
# Заполнение пропущенных значений заполнением из следующей ячейки
df['Value'].fillna(method='bfill', inplace=True)
print("Заполнение из следующей ячейки:")
print(df)
Таким образом, мы рассмотрели различные примеры использования fillna в языке программирования Python. Метод fillna предоставляет гибкие возможности для заполнения пропущенных значений в структурах данных и может быть настроен в соответствии с требованиями конкретных задач анализа данных.