如何在 pandas dataframe 的列中将所有 nan 值替换为零-ag捕鱼王app官网

如何在 pandas dataframe 的列中将所有 nan 值替换为零

作者:迹忆客 最近更新:2024/04/23 浏览次数:

当我们处理大型数据集时,有时数据集中会有 nan 值要用某个平均值或合适的值替换。例如,你有一个学生评分列表,有些学生没有参加测验,因此系统自动输入了 nan 而不是 0.0。下面列出了完成此任务的不同方法。

在以下各节中,我们将使用相同的 dataframe,如下所示:

import pandas as pd
import numpy as np
data = {
    "name": ["oliver", "harry", "george", "noah"],
    "percentage": [90, 99, 50, 65],
    "grade": [88, np.nan, 95, np.nan],
}
df = pd.dataframe(data)
print(df)

以下是等级为 nandataframe

     name  percentage  grade
0  oliver          90   88.0
1   harry          99    nan
2  george          50   95.0
3    noah          65    nan

df.fillna() 方法将所有 nan 值替换为零

让我们借助 df.fillna() 方法替换 nan 值。

import pandas as pd
import numpy as np
data = {
    "name": ["oliver", "harry", "george", "noah"],
    "percentage": [90, 99, 50, 65],
    "grade": [88, np.nan, 95, np.nan],
}
df = pd.dataframe(data)
df = df.fillna(0)
print(df)

以下是将 nan 替换为 0 的输出。

     name  percentage  grade
0  oliver          90   88.0
1   harry          99    0.0
2  george          50   95.0
3    noah          65    0.0

df.fillna() 方法用给定值填充 nan 值。它不会更改对象数据,但默认情况下会返回一个新的 dataframe,除非将 inplace 参数设置为 true。

我们可以通过设置 inplace 参数为 true 来重写上述代码。

import pandas as pd
import numpy as np
data = {
    "name": ["oliver", "harry", "george", "noah"],
    "percentage": [90, 99, 50, 65],
    "grade": [88, np.nan, 95, np.nan],
}
df = pd.dataframe(data)
df.fillna(0, inplace=true)
print(df)

df.replace() 方法

此方法与 df.fillna() 相同,将 nan 替换为 0df.replace() 也可用于替换其他数字。让我们看一下代码。

import pandas as pd
import numpy as np
data = {
    "name": ["oliver", "harry", "george", "noah"],
    "percentage": [90, 99, 50, 65],
    "grade": [88, np.nan, 95, np.nan],
}
df = pd.dataframe(data)
nan_replaced = df.replace(np.nan, 0)
print(nan_replaced)

以下是输出。

     name  percentage  grade
0  oliver          90   88.0
1   harry          99    0.0
2  george          50   95.0
3    noah          65    0.0

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

pandas read_csv()函数

发布时间:2024/04/24 浏览次数:254 分类:python

pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 dataframe 中。

pandas 追加数据到 csv 中

发布时间:2024/04/24 浏览次数:352 分类:python

本教程演示了如何在追加模式下使用 to_csv()向现有的 csv 文件添加数据。

pandas 多列合并

发布时间:2024/04/24 浏览次数:628 分类:python

本教程介绍了如何在 pandas 中使用 dataframe.merge()方法合并两个 dataframes。

pandas loc vs iloc

发布时间:2024/04/24 浏览次数:837 分类:python

本教程介绍了如何使用 python 中的 loc 和 iloc 从 pandas dataframe 中过滤数据。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便
网站地图