DataStudy Blog
Python

Pythonで始めるデータ分析入門

pandasとmatplotlibを使った基本的なデータ分析の手法を、実際のコード例とともに解説します。

はじめに

データ分析の第一歩として、Pythonのpandasライブラリとmatplotlibを使った基本的な操作を学びましょう。

pandasでデータを読み込む

まずはCSVファイルの読み込みから始めます。

import pandas as pd

df = pd.read_csv("data.csv")
print(df.head())

head() メソッドでデータの先頭5行を確認できます。

基本的な統計量の確認

# 基本統計量の表示
print(df.describe())

# 欠損値の確認
print(df.isnull().sum())
統計量意味
countデータ数
mean平均値
std標準偏差
min最小値
max最大値

matplotlibでの可視化

import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
plt.hist(df["score"], bins=20, color="#3b82f6", edgecolor="white")
plt.title("スコア分布")
plt.xlabel("スコア")
plt.ylabel("頻度")
plt.show()

まとめ

  • pandasはデータの読み込みと加工に便利
  • describe() で基本統計量を素早く把握
  • matplotlibで直感的な可視化が可能

次回は、より高度な分析手法について紹介していきます。