在 pandas 中执行 t 检验
本教程将讨论如何在 pandas 中找到 t 检验值。
在 pandas 中执行 t 检验的步骤
以下是在 pandas 中执行 t 检验的步骤。
导入相关库
我们必须从 scipy.stats 导入 pandas 库和 ttest_ind
才能开始。
import pandas as pd
from scipy.stats import ttest_ind
创建一个 pandas dataframe
让我们创建一个示例 dataframe 来对同一 dataframe 执行 t 检验操作。
data = {
"category": [
"type2",
"type1",
"type2",
"type1",
"type2",
"type1",
"type2",
"type1",
"type1",
"type1",
"type2",
],
"values": [1, 2, 3, 1, 2, 3, 1, 2, 3, 5, 1],
}
df = pd.dataframe(data)
我们创建了一个 dataframe,其中包含一个包含两种类别的类别列,并为每个类别实例分配了一个值。
让我们在下面查看我们的 dataframe。
print(df)
输出:
category values
0 type2 1
1 type1 2
2 type2 3
3 type1 1
4 type2 2
5 type1 3
6 type2 1
7 type1 2
8 type1 3
9 type1 5
10 type2 1
我们现在将使用以下代码为这两种类别类型创建一个单独的 dataframe。此步骤有助于 t 检验查找过程。
type1 = my_data[my_data["category"] == "type1"]
type2 = my_data[my_data["category"] == "type2"]
在 pandas 中获取 t 检验值
我们现在将找到 t 检验结果并使用 ttest_ind()
函数将它们存储在一个变量中。我们通过以下方式使用此功能。
res = ttest_ind(type1["values"], type2["values"])
在上面的代码中,我们将 dataframe 作为参数传递给函数,我们得到了 t 检验结果,包括一个具有 t 统计量和 p 值的元组。
现在让我们打印 res
变量以查看结果。
print(res)
输出:
ttest_indresult(statistic=1.4927289925706944, pvalue=0.16970867501294376)
在上面的输出中,我们找到了具有 t 统计量和 p 值的 t 检验值。因此,我们可以通过上述方法成功找到 pandas 中的 t 检验值。
转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处
本文地址:
相关文章
pandas dataframe dataframe.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:python
-
dataframe.shift() 函数是将 dataframe 的索引按指定的周期数进行移位。
python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:python
-
python pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:python
-
pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 dataframe 中。
pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:python
-
本教程介绍了如何在 pandas 中使用 dataframe.merge()方法合并两个 dataframes。
pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:python
-
本教程介绍了如何使用 python 中的 loc 和 iloc 从 pandas dataframe 中过滤数据。
在 python 中将 pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:python
-
了解如何在 python 中将 pandas 系列日期时间转换为字符串