Python
Pythonで始めるデータ分析入門
pandasとmatplotlibを使った基本的なデータ分析の手法を、実際のコード例とともに解説します。
はじめに
データ分析の第一歩として、Pythonのpandasライブラリとmatplotlibを使った基本的な操作を学びましょう。
pandasでデータを読み込む
まずはCSVファイルの読み込みから始めます。
import pandas as pd
df = pd.read_csv("data.csv")
print(df.head())
head() メソッドでデータの先頭5行を確認できます。
基本的な統計量の確認
# 基本統計量の表示
print(df.describe())
# 欠損値の確認
print(df.isnull().sum())
| 統計量 | 意味 |
|---|---|
| count | データ数 |
| mean | 平均値 |
| std | 標準偏差 |
| min | 最小値 |
| max | 最大値 |
matplotlibでの可視化
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 6))
plt.hist(df["score"], bins=20, color="#3b82f6", edgecolor="white")
plt.title("スコア分布")
plt.xlabel("スコア")
plt.ylabel("頻度")
plt.show()
まとめ
- pandasはデータの読み込みと加工に便利
describe()で基本統計量を素早く把握- matplotlibで直感的な可視化が可能
次回は、より高度な分析手法について紹介していきます。