pandas vlookup
vlookup 代表垂直查找。vlookup 用于合并两个不同的表,两个表之间应该至少有一个共同的属性。
作为输出,我们将得到一个由两个表中的数据组成的表。这个过程类似于 sql 中的 join() 查询。
要在 python 中连接两个 dataframe,我们可以使用 pandas 库中提供的 merge() 方法。有很多方法可以合并两个表。
在 pandas 中使用 inner join 执行 vlookup
inner join 合并表中的那些行,这些行具有匹配的键值。它返回两个表中满足条件的所有行。
在下面的示例中,我们打开了两个表。student 表由 st_id、st_name 和 department 列组成。
另一个是 course 表,其中包含有关学生注册的课程的信息。课程表的列是 st_id 和 course。
我们通过使用 pandas 对象调用 merge() 方法来执行 inner join,并传递了两个表、合并表的列名和指定的 inner join。
这两个表将根据 st_id 值组合成一个表作为输出。
如果学生表中的 st_id 值与课程表的 st_id 值匹配的条件,则将选择这些记录进行合并。这里的 st_id 就像 sql 中的外键一样工作。
# python 3.x
import pandas as pd
student = pd.read_csv("student.csv")
course = pd.read_csv("course.csv")
print(student)
print(course)
inner_join = pd.merge(student, course, on="st_id", how="inner")
print(inner_join)
输出:
在 pandas 中使用 left join 执行 vlookup
left join 的工作方式类似于 inner join,但唯一的区别是它包括所有左表/第一个表行和第二个表的匹配行。在下面的示例中,我们通过在 merge() 方法调用中指定 left 来执行 left join。
作为输出,我们可以看到所有匹配的记录,加上左表中的额外记录也包含在最终表中。如果在第二个表中没有找到匹配的记录,则该行的值将是 nan(不是数字)。
# python 3.x
import pandas as pd
student = pd.read_csv("student.csv")
course = pd.read_csv("course.csv")
print(student)
print(course)
left_join = pd.merge(student, course, on="st_id", how="left")
print(left_join)
输出:
在 pandas 中使用 right join 执行 vlookup
右连接与左连接相反。右连接就像内连接;但是,唯一的区别是它包括所有正确的表/第二个表行和两个表的匹配行。
下面的示例通过在 merge() 方法调用中指定 right 来执行 right join。作为输出,我们可以看到所有匹配的记录以及右表中的额外记录都包含在最终表中。
如果在第一个表中没有找到匹配的记录,则该行的值将是 nan(不是数字)。
# python 3.x
import pandas as pd
student = pd.read_csv("student.csv")
course = pd.read_csv("course.csv")
print(student)
print(course)
right_join = pd.merge(student, course, on="st_id", how="right")
print(right_join)
输出:
在 pandas 中使用 outer join 执行 vlookup
外连接是左连接和右连接的组合。它结合了左表和右表中的所有行。
如果没有找到匹配的值,nan 将出现在该行中。
# python 3.x
import pandas as pd
student = pd.read_csv("student.csv")
course = pd.read_csv("course.csv")
print(student)
print(course)
outer_join = pd.merge(student, course, on="st_id", how="outer")
print(outer_join)
输出:
转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处
本文地址:
相关文章
pandas dataframe dataframe.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:python
-
dataframe.shift() 函数是将 dataframe 的索引按指定的周期数进行移位。
python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:python
-
python pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:python
-
pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 dataframe 中。
pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:python
-
本教程介绍了如何在 pandas 中使用 dataframe.merge()方法合并两个 dataframes。
pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:python
-
本教程介绍了如何使用 python 中的 loc 和 iloc 从 pandas dataframe 中过滤数据。
在 python 中将 pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:python
-
了解如何在 python 中将 pandas 系列日期时间转换为字符串

