pandas dataframe dataframe.plot.hist() 函数
python pandas dataframe.plot.hist() 函数绘制了一个 dataframe
的列的单一直方图。直方图以图形的形式表示数据。它可以创建范围的条形图。越高的条形图表明有更多的数据落入这个条形图的范围。
pandas.dataframe.plot.hist()
语法
dataframe.sample(by=none, bins=10, **kwargs)
参数
by |
它是一个字符串或序列。它代表 dataframe 中要分组的列。 |
bins |
它是一个整数。它表示直方块的数量。一个直方块就像一个范围,例如,0-5,6-10 等。 |
**kwargs |
这些是自定义直方图的附加关键字参数。你可以在查看更多信息。 |
返回值
它返回一个绘制的直方图和 axessubplot
数据。
示例代码:dataframe.plot.hist()
让我们先用一个简单的 dataframe
绘制一个直方图。
import pandas as pd
dataframe = pd.dataframe({'value':[100, 200, 300]})
print(dataframe)
我们的 dataframe
看起来像,
value
0 100
1 200
2 300
这个函数的所有参数都是可选的。如果我们在执行这个函数时不传递任何参数,那么它将产生以下输出。
import pandas as pd
from matplotlib import pyplot as plt
dataframe = pd.dataframe({"value": [100, 200, 300]})
histogram = dataframe.plot.hist()
print(histogram)
plt.show()
输出:
axessubplot(0.125,0.125;0.775x0.755)
示例代码:dataframe.plot.hist()
绘制复杂的直方图
现在,我们将把我们的 dataframe
转换为一个复杂的情况。
import pandas as pd
import numpy as np
dataframe = pd.dataframe(np.random.randint(0, 200, size=(200, 3)), columns=list("abc"))
print(dataframe)
我们的 dataframe
变成:
a b c
0 15 163 163
1 29 7 54
2 195 40 6
3 183 92 57
4 72 167 40
.. ... ... ...
195 79 35 7
196 122 79 142
197 121 46 124
198 138 141 114
199 148 95 129
[200 rows x 3 columns]
我们已经使用 numpy.random.randint() 函数创建了一个包含随机整数的 dataframe
。现在,我们将使用 dataframe.plot.hist()
函数绘制这个 dataframe
的直方图。
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
dataframe = pd.dataframe(np.random.randint(0, 200, size=(200, 3)), columns=list("abc"))
histogram = dataframe.plot.hist()
print(histogram)
plt.show()
输出:
axessubplot(0.125,0.125;0.775x0.755)
该函数绘制了一个直方图,默认有 10 个 bin
。它显示了 dataframe
中三列的频率分布。每一列用特定的颜色表示。
示例代码: dataframe.plot.hist()
改变 bin
数量
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
dataframe = pd.dataframe(np.random.randint(0, 200, size=(200, 3)), columns=list("abc"))
histogram = dataframe.plot.hist(bins=2)
print(histogram)
plt.show()
输出:
axessubplot(0.125,0.125;0.775x0.755)
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
dataframe = pd.dataframe(np.random.randint(0, 200, size=(200, 3)), columns=list("abc"))
histogram = dataframe.plot.hist(bins=50)
print(histogram)
plt.show()
输出:
axessubplot(0.125,0.125;0.775x0.755)
在第一个例子的代码中,我们将 bins
数改为 2,而在第二个例子的代码中,则是 50。请注意,bins
数越多,越容易理解直方图。第一个直方图是模糊的,因为我们无法看到 a
栏。
转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处
本文地址:
相关文章
pandas dataframe dataframe.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:python
-
dataframe.shift() 函数是将 dataframe 的索引按指定的周期数进行移位。
python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:python
-
python pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:python
-
pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 dataframe 中。
pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:python
-
本教程介绍了如何在 pandas 中使用 dataframe.merge()方法合并两个 dataframes。
pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:python
-
本教程介绍了如何使用 python 中的 loc 和 iloc 从 pandas dataframe 中过滤数据。
在 python 中将 pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:python
-
了解如何在 python 中将 pandas 系列日期时间转换为字符串