Zipf 分布
创建于 2024-12-03 /
23
字体:
[默认]
[大]
[更大]
Zipf 分布用于根据 zipf 定律对数据进行采样。
齐夫定律: 在一个集合中,第 n 个常用项是最常用项的 1/n 倍。 例如。 英语中第 5 个常用词的出现次数几乎是最常用词的 1/5。
它有两个参数:
a
- 分布参数。
size
- 返回数组的形状。
实例
抽取一个分布参数为 2、大小为 2x3 的 zipf 分布样本:
from numpy import randomx = random.zipf(a=2, size=(2, 3))
print(x) 亲自试一试 »
Zipf 分布的可视化
采样 1000 个点,但仅绘制值
的点 10 表示更有意义的图表。
实例
from numpy import randomimport matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()
Result
0 人点赞过