pandas dataframe dataframe.aggregate() 函数
pandas.dataframe.aggregate() 函数对一个 dataframe
的列或行进行聚合。最常用的聚合函数是 min
、max
和 sum
。这些聚合函数的结果是减小 dataframe
的大小。
pandas.dataframe.aggregate()
语法
dataframe.aggregate(func, axis, *args, **kwargs)
参数
func |
它是要应用的聚合函数。它可以是可调用函数或可调用函数列表,字符串或字符串列表,或字典 |
axis |
默认为 0。如果是 0 或'index' ,则函数应用于各个列。如果是 1 或'column' ,则函数应用于各个行 |
*args |
这是一个位置型参数 |
**kwargs |
这是一个关键字参数 |
返回值
该函数返回一个标量、series
或 dataframe
。
- 如果用
series.aggressive()
调用一个函数,它返回一个scalar
。 - 如果用
dataframe.agg()
调用一个函数,它返回一个series
。 - 如果多个函数被调用
dataframe.agg()
,它返回一个dataframe
。
示例代码:pandas dataframe.aggregate()
dataframe.agg()
是 dataframe.aggregate()
的别名。因为简洁,我们最好使用别名。所以我们将在示例代码中使用 dataframe.agg()
。
import pandas as pd
dataframe=pd.dataframe({'attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'name': {0: 'olivia', 1: 'john', 2: 'laura',3: 'ben',4: 'kevin'},
'obtained marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print(dataframe)
下面是 dataframe
的示例。
attendance name obtained marks
0 60 olivia 90
1 100 john 75
2 80 laura 82
3 78 ben 64
4 95 kevin 45
我们先只用一个聚合函数来检查 dataframe.agg()
函数。
import pandas as pd
dataframe = pd.dataframe(
{
"attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"name": {0: "olivia", 1: "john", 2: "laura", 3: "ben", 4: "kevin"},
"obtained marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg("sum")
print(dataframe1)
输出:
attendance 413
name oliviajohnlaurabenkevin
obtained marks 356
dtype: object
聚合函数 sum
被应用于各个列。
对于整数类型的列,它生成了和;对于字符串类型的列,它对字符串进行了连接。dtype: object
表示出了函数返回 series
。
示例代码:dataframe.aggregate()
与多函数的关系
import pandas as pd
dataframe = pd.dataframe(
{
"attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"name": {0: "olivia", 1: "john", 2: "laura", 3: "ben", 4: "kevin"},
"obtained marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg(["sum", "min"])
print(dataframe1)
输出:
attendance name obtained marks
sum 413 oliviajohnlaurabenkevin 356
min 60 ben 45
聚合函数 sum
和 min
应用于各个列。
对于整数类型的列,min
函数生成了最小值,对于字符串类型的列,它显示了最小长度的字符串。
示例代码:dataframe.aggregate()
与指定列的聚合
import pandas as pd
dataframe = pd.dataframe(
{
"attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"name": {0: "olivia", 1: "john", 2: "laura", 3: "ben", 4: "kevin"},
"obtained marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"obtained marks": "sum"})
print(dataframe1)
输出:
obtained marks 356
dtype: int64
返回单列之和。dtype: int64
表明该函数返回了一个 series
。
我们也可以在一列上应用多个函数。
import pandas as pd
dataframe = pd.dataframe(
{
"attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"name": {0: "olivia", 1: "john", 2: "laura", 3: "ben", 4: "kevin"},
"obtained marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"obtained marks": ["sum", "max"]})
print(dataframe1)
输出:
obtained marks
sum 356
max 90
转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处
本文地址:
相关文章
pandas dataframe dataframe.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:python
-
dataframe.shift() 函数是将 dataframe 的索引按指定的周期数进行移位。
python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:python
-
python pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:python
-
pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 dataframe 中。
pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:python
-
本教程介绍了如何在 pandas 中使用 dataframe.merge()方法合并两个 dataframes。
pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:python
-
本教程介绍了如何使用 python 中的 loc 和 iloc 从 pandas dataframe 中过滤数据。
在 python 中将 pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:python
-
了解如何在 python 中将 pandas 系列日期时间转换为字符串