将 json 转换为 pandas dataframe
本文将介绍如何将 json 转换为 pandas dataframe。
json 是 javascript object notation 的缩写,它是基于 javascript 中对象的格式,是一种表示结构化数据的编码技术。它是基于 javascript 中对象的格式,是一种表示结构化数据的编码技术。目前,它被广泛使用,特别是在服务器和 web 应用程序之间共享数据。
由于它的简单性和受编程语言数据结构的影响,json 正变得非常流行。它比较容易理解,下面是一个简单的 api 的 json 响应的例子。
{
"results":
[
{ "id": "01", "name": "jay" },
{ "id": "02", "name": "mark" },
{ "id": "03", "name": "jack" }
],
"status": ["ok"]
}
在我们的例子中可以看到,json 在某种程度上似乎是嵌套列表和字典的结合,因此,从 json 文件中提取数据,甚至将其存储为 pandas dataframe 是比较容易的。
python 中的 pandas 和 json 库可以帮助实现这个功能。我们有两个函数 read_json()
和 json_normalize()
可以帮助将 json 字符串转换为 dataframe。
使用 json_normalize()
将 json 转换为 pandas dataframe
json_normalize()
函数被非常广泛地用于读取嵌套的 json 字符串并返回一个 dataframe。要使用这个函数,我们首先需要使用 python 中 json 库中的 json.loads()
函数来读取 json 字符串,然后我们将这个 json 对象传递给 json_normalize()
,它将返回一个包含所需数据的 pandas dataframe。
import pandas as pd
import json
from pandas import json_normalize
data = """
{
"results":
[
{ "id": "1", "name": "jay" },
{ "id": "2", "name": "mark" },
{ "id": "3", "name": "jack" }
],
"status": ["ok"]
}
"""
info = json.loads(data)
df = json_normalize(info["results"]) # results contain the required data
print(df)
输出:
id name
0 1 jay
1 2 mark
2 3 jack
使用 read_json()
将 json 转换为 pandas dataframe
另一个将 json 转换为 dataframe 的 pandas 函数是 read_json()
,用于简单的 json 字符串。我们可以直接将 json 文件的路径或 json 字符串传递给函数,以便将数据存储在 pandas dataframe 中。read_json()
有很多参数,其中 orient
指定 json 字符串的格式。
缺点是它很难与嵌套的 json 字符串一起使用。因此,为了使用 read_json()
,我们将使用一个简单得多的例子,如下所示。
import pandas as pd
data = """
{
"0":{
"name": "jay",
"age": "17"
},
"1":{
"name": "mark",
"age": "15"
},
"2":{
"name": "jack",
"age":"16"
}
}
"""
df = pd.read_json(data, orient="index")
print(df)
输出:
name age
0 jay 17
1 mark 15
2 jack 16
我们将 orient
设置为 'index'
,因为 fromat 的 json 字符串匹配的模式是 {index : {column: value}}
。
转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处
本文地址:
相关文章
pandas dataframe dataframe.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:python
-
dataframe.shift() 函数是将 dataframe 的索引按指定的周期数进行移位。
python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:python
-
python pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:python
-
pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 dataframe 中。
pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:python
-
本教程介绍了如何在 pandas 中使用 dataframe.merge()方法合并两个 dataframes。
pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:python
-
本教程介绍了如何使用 python 中的 loc 和 iloc 从 pandas dataframe 中过滤数据。
在 python 中将 pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:python
-
了解如何在 python 中将 pandas 系列日期时间转换为字符串