統計学
正規分布の基礎と応用
統計学の中心的な概念である正規分布について、その性質、確率密度関数、標準化の方法を解説します。
正規分布とは
正規分布(ガウス分布)は、統計学で最も重要な確率分布の一つです。自然界や社会現象の多くが正規分布に従うことが知られています。
確率密度関数
正規分布の確率密度関数は以下の式で表されます:
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
ここで:
- μ(ミュー):平均値
- σ(シグマ):標準偏差
標準正規分布
平均0、標準偏差1の正規分布を標準正規分布と呼びます。
任意の正規分布を標準正規分布に変換するには、以下の標準化を行います:
z = \frac{x - \mu}{\sigma}
Pythonでの描画
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
x = np.linspace(-4, 4, 1000)
y = norm.pdf(x, 0, 1)
plt.figure(figsize=(8, 5))
plt.plot(x, y, color="#2563eb", linewidth=2)
plt.fill_between(x, y, alpha=0.1, color="#2563eb")
plt.title("標準正規分布")
plt.xlabel("z")
plt.ylabel("確率密度")
plt.grid(True, alpha=0.3)
plt.show()
68-95-99.7ルール
正規分布では、平均からの距離に応じて以下の割合のデータが含まれます:
| 範囲 | 含まれるデータの割合 |
|---|---|
| μ ± 1σ | 約68.3% |
| μ ± 2σ | 約95.4% |
| μ ± 3σ | 約99.7% |
この性質は、異常値の検出や品質管理などで広く活用されています。
まとめ
正規分布は統計学の基盤となる概念です。標準化やz値の理解は、仮説検定や信頼区間の構築に不可欠です。