Zipf 分布

创建于 2024-12-03 / 23
字体: [默认] [大] [更大]

Zipf 分布用于根据 zipf 定律对数据进行采样。

齐夫定律: 在一个集合中,第 n 个常用项是最常用项的 1/n 倍。 例如。 英语中第 5 个常用词的出现次数几乎是最常用词的 1/5。

它有两个参数:

a - 分布参数。

size - 返回数组的形状。

实例

抽取一个分布参数为 2、大小为 2x3 的 zipf 分布样本:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x) 亲自试一试 »

Zipf 分布的可视化

采样 1000 个点,但仅绘制值

的点 10 表示更有意义的图表。

实例

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

Result

亲自试一试 »

0 人点赞过