DataStudy Blog
統計学

正規分布の基礎と応用

統計学の中心的な概念である正規分布について、その性質、確率密度関数、標準化の方法を解説します。

正規分布とは

正規分布(ガウス分布)は、統計学で最も重要な確率分布の一つです。自然界や社会現象の多くが正規分布に従うことが知られています。

確率密度関数

正規分布の確率密度関数は以下の式で表されます:

f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)

ここで:

  • μ(ミュー):平均値
  • σ(シグマ):標準偏差

標準正規分布

平均0、標準偏差1の正規分布を標準正規分布と呼びます。

任意の正規分布を標準正規分布に変換するには、以下の標準化を行います:

z = \frac{x - \mu}{\sigma}

Pythonでの描画

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

x = np.linspace(-4, 4, 1000)
y = norm.pdf(x, 0, 1)

plt.figure(figsize=(8, 5))
plt.plot(x, y, color="#2563eb", linewidth=2)
plt.fill_between(x, y, alpha=0.1, color="#2563eb")
plt.title("標準正規分布")
plt.xlabel("z")
plt.ylabel("確率密度")
plt.grid(True, alpha=0.3)
plt.show()

68-95-99.7ルール

正規分布では、平均からの距離に応じて以下の割合のデータが含まれます:

範囲含まれるデータの割合
μ ± 1σ約68.3%
μ ± 2σ約95.4%
μ ± 3σ約99.7%

この性質は、異常値の検出や品質管理などで広く活用されています。

まとめ

正規分布は統計学の基盤となる概念です。標準化やz値の理解は、仮説検定や信頼区間の構築に不可欠です。