追加到 pandas 中的空 dataframe
正如我们之前所了解的,python 中的 pandas 是一个开源模块,我们可以使用它进行数据分析和制作机器学习模型。它与另一个名为 numpy
的包一起使用,因为它们携手支持多维数组。
许多数据科学模块可以与 python 生态系统中的 pandas 一起使用。我们将学习在 pandas 中附加到空 dataframe 的不同操作。
dataframe 是表格形式的二维和潜在的异构数据。
本教程教授如何使用 python 在 pandas 的空 dataframe 中添加行和列。我们将研究三种不同的方法来向空 dataframe 添加数据,因为有多种方法。
在 pandas 中创建一个空 dataframe 并添加行和列
下面是导入所需包、制作空 dataframe 和附加列的代码。
# import pandas library as pd
import pandas as pd
# create an empty dataframe object
df = pd.dataframe()
print(df)
# append columns to an empty dataframe
df["name"] = ["preet", "parin", "rajesh"]
df["articles"] = [97, 600, 200]
df["improved"] = [2200, 75, 100]
print(df)
上述代码片段的输出如下。
empty dataframe
columns: []
index: []
name articles improved
0 preet 97 2200
1 parin 600 75
2 rajesh 200 100
在我们添加列和行之前,dataframe 是空的。因此,打印空 dataframe 为我们提供了输出 empty dataframe, columns: [], index: []
作为输出,这是预期的,因为数据为空。
将行附加到具有 pandas 列的空 dataframe
在这个方法中,dataframe 是空的,但是会有预定义的列名,我们唯一的任务就是在它下面的行中插入数据。
下面是上述方法的代码,我们最初导入库 pandas,创建一个包含列的 dataframe,然后以行的形式附加值。
# import pandas library as pd
import pandas as pd
# create an empty dataframe
# object with column names only
df = pd.dataframe(columns=["name", "articles", "improved"])
print(df)
# append rows to an empty dataframe
df = df.append({"name": "preet", "articles": 97, "improved": 2200}, ignore_index=true)
df = df.append({"name": "parin", "articles": 30, "improved": 50}, ignore_index=true)
df = df.append({"name": "rajesh", "articles": 17, "improved": 220}, ignore_index=true)
print(df)
该代码将为我们提供以下输出。
empty dataframe
columns: [name, articles, improved]
index: []
name articles improved
0 preet 97 2200
1 parin 30 50
2 rajesh 17 220
正如我们所看到的,由于我们已经在 dataframe 中添加了列的名称,因此输出由 columns: [name, articles, improvement]
组成,它是数组中的列名称。
以下输出是因为我们使用了 .append()
函数。
使用 pandas 中的 .loc()
函数创建一个空 dataframe,包括带有索引的列和附加行
pandas 中的 .loc()
方法可帮助用户轻松地从 dataframe 中检索值,而不会带来任何复杂性。可以根据函数中传递的索引值访问特定行和列中的值。
在这种方法中,我们将创建一个空的 dataframe 和列名。将使用索引来识别每一列来访问它。
接下来我们将一个接一个地追加行。
下面给出了证明这种方法的代码。
# import pandas library as pd
import pandas as pd
# create an empty dataframe object with
# column names and indices
df = pd.dataframe(columns=["name", "articles", "improved"], index=["a", "b", "c"])
print("empty dataframe with nan values : \n\n", df)
# adding rows to an empty
# dataframe at existing index
df.loc["a"] = ["preet", 50, 100]
df.loc["b"] = ["parin", 60, 120]
df.loc["c"] = ["rajesh", 30, 60]
print(df)
上面给出的代码的输出如下。
empty dataframe with nan values :
name articles improved
a nan nan nan
b nan nan nan
c nan nan nan
name articles improved
a preet 50 100
b parin 60 120
c rajesh 30 60
正如我们所观察到的,第一个表中的 nan
值是因为我们提到了索引,但这些值仍然为空。
提供索引的数量会将表绑定到该特定实例的那么多值。增加索引的数量允许插入更多的值。
因此,在本教程中,我们学习了在 pandas 中将值附加到 dataframe 的三种不同方法。
转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处
本文地址:
相关文章
pandas dataframe dataframe.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:python
-
dataframe.shift() 函数是将 dataframe 的索引按指定的周期数进行移位。
python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:python
-
python pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:python
-
pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 dataframe 中。
pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:python
-
本教程介绍了如何在 pandas 中使用 dataframe.merge()方法合并两个 dataframes。
pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:python
-
本教程介绍了如何使用 python 中的 loc 和 iloc 从 pandas dataframe 中过滤数据。
在 python 中将 pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:python
-
了解如何在 python 中将 pandas 系列日期时间转换为字符串