ポアソン分布は、ある特定の時間や空間内で独立したイベントが発生する回数を表す確率分布です。
例えば、1時間の間に特定のウェブサイトにアクセスする回数や、1kmの道路にあるポットホールの数などがポアソン分布に従うことがあります。
目次
ポアソン分布の特徴
ポアソン分布は以下のような特徴を持ちます。
- λ (ラムダ) というパラメータで定義される。
このλは単位時間あたりに期待されるイベントの発生回数を表します。 - 任意の単位時間内で発生するイベントが独立していること。
- イベントの発生確率は時間に比例する。
Pythonでポアソン分布を実装する方法
Pythonでは、便利なライブラリであるNumPyを使用してポアソン分布を簡単に扱うことができます。
以下にその手順を紹介します。
必要なライブラリのインストール
pip install numpy
ポアソン分布のサンプルを生成
NumPyのrandom.poisson
関数を使用して、ポアソン分布に従うデータを生成する例を示します。
import numpy as np
# 平均λを設定します
lambda_value = 3
# ポアソン分布に従うデータを生成します
data = np.random.poisson(lambda_value, 1000)
# データの一部を表示します
print(data[:10])
生成したデータの可視化
生成したデータを可視化するために、Matplotlibを使用することができます。
import matplotlib.pyplot as plt
# ヒストグラムでデータを表示します
plt.hist(data, bins=15, edgecolor='k', alpha=0.7)
plt.title('Poisson Distribution (λ=3)')
plt.xlabel('Number of events')
plt.ylabel('Frequency')
plt.show()
ポアソン分布の応用例
ポアソン分布は様々な分野で応用されています。
以下は一部の例です。
- コールセンターで1時間内に受ける電話の数。
- 病院の救急科に1日内に来る患者の数。
- 製造業で一定期間に発生する故障の数。
まとめ
ポアソン分布は、特定の時間や空間内で独立して発生するイベントの回数をモデル化するために非常に有用です。
PythonのNumPyライブラリを使用することで、簡単にポアソン分布を生成し、分析することができます。
この記事で紹介した方法を利用して、自分のデータセットを解析してみてください。
以上、ポアソン分布についてでした。
最後までお読みいただき、ありがとうございました。