Замена пропущенных значений с помощью функции fillna

Метод fillna в языке программирования Python

Метод fillna в языке программирования Python

Метод fillna в языке программирования Python используется для замены отсутствующих значений (NaN) в структурах данных, таких как массивы, списки, серии или фреймы данных. Он предоставляет возможность заполнить пропущенные значения определенными значениями или применить различные стратегии интерполяции для их замены.

Часто в реальном мире данные содержат пропущенные значения, которые могут возникать из разных причин, таких как ошибки ввода, потеря данных, ошибки обработки и т.д. Пропущенные значения могут вызвать проблемы при анализе данных и моделировании, поэтому fillna является очень полезной функцией для их обработки.

Примеры использования fillna:

Пример 1: Заполнение пропущенных значений в списке


import pandas as pd
import numpy as np

data = [1, 2, np.nan, 4, np.nan, 6, 7, np.nan, 9]
df = pd.DataFrame(data, columns=['Value'])
print("Исходный список:")
print(df)

# Заполнение пропущенных значений с помощью числа 0
df['Value'].fillna(0, inplace=True)
print("Заполнение значениями 0:")
print(df)
    

Пример 2: Заполнение пропущенных значений в фрейме данных


import pandas as pd
import numpy as np

data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [25, np.nan, 37, 29],
        'Salary': [50000, np.nan, 75000, np.nan]}
df = pd.DataFrame(data)
print("Исходный фрейм данных:")
print(df)

# Заполнение пропущенных значений средним значением столбца
df['Age'].fillna(df['Age'].mean(), inplace=True)

# Заполнение пропущенных значений медианой столбца
df['Salary'].fillna(df['Salary'].median(), inplace=True)
print("Заполнение средним значением и медианой:")
print(df)
    

Пример 3: Сложные стратегии заполнения пропущенных значений


import pandas as pd
import numpy as np

data = [1, np.nan, np.nan, 4, 5, np.nan, 7, 8, np.nan]
df = pd.DataFrame(data, columns=['Value'])
print("Исходный список:")
print(df)

# Заполнение пропущенных значений прямым заполнением
df['Value'].fillna(method='ffill', inplace=True)
print("Прямое заполнение:")
print(df)

# Заполнение пропущенных значений заполнением из следующей ячейки
df['Value'].fillna(method='bfill', inplace=True)
print("Заполнение из следующей ячейки:")
print(df)
    

Таким образом, мы рассмотрели различные примеры использования fillna в языке программирования Python. Метод fillna предоставляет гибкие возможности для заполнения пропущенных значений в структурах данных и может быть настроен в соответствии с требованиями конкретных задач анализа данных.

Похожие вопросы на: "fillna "

Str в питоне: основные функции и методы
Симуляция трафика: управление движением на дорогах
Err Bad SSL Client Auth Cert – проблема с клиентским сертификатом аутентификации SSL
Print Post - печать публикаций
Chart JS: Создание интерактивных графиков и диаграмм
Страница о s n
Python bin - работа с двоичными данными на языке Python
SQL Convert: преобразование данных в SQL
Система C: управление и оптимизация бизнес-процессов
Minify JS: эффективное сжатие кода для быстрой загрузки страницы