サイトアイコン ITC Media

MatplotlibでヒートマップをPythonで描く方法!初心者でも実践的なグラフを作成

(最終更新月: 2024年11月)

✔こんな方におすすめの記事です

「Pythonでヒートマップを作りたいけど方法がわからない」
「Matplotlibのヒートマップの基本を学びたい」
「ヒートマップを使って効果的なデータ可視化をしたい」

✔当記事を通じて得られること

当記事では、Matplotlibでのヒートマップ作成の基礎から応用まで、実例を交えて幅広く解説していきます。
ぜひ最後までご覧ください。

筆者プロフィール

【現職】プロダクトマネージャー

【副業】ブログ(月間20万PV)/YouTube/Web・アプリ制作

「プログラミング × ライティング × 営業」の経験を活かし、30後半からのIT系職へシフト。現在はプロダクトマネージャーとして、さまざまな関係者の間に入り奮闘してます。当サイトでは、実際に手を動かせるWebアプリの開発を通じて、プログラミングはもちろん、IT職に必要な情報を提供していきます。

【当ブログで紹介しているサイト】

当サイトチュートリアルで作成したデモ版日報アプリ

Django × Reactで開発したツール系Webアプリ

✔人に見せても恥ずかしくないコードを書こう

「リーダブルコード」は、わかりやすく良いコードの定義を教えてくれる本です。

  • 見るからにきれいなコードの書き方
  • コードの分割方法
  • 変数や関数の命名規則

エンジニアのスタンダートとすべき基準を一から解説しています。

何回も読むのに値する本なので、ぜひ手にとって読んでみてください。

Matplotlibのヒートマップとは

Matplotlibを使用したヒートマップは、データの値を色の濃淡で表現する視覚化手法です。
データ分析や科学研究において、複雑なデータを直感的に理解するために重要な役割を果たしています。

ヒートマップの基本概念

ヒートマップは、2次元のデータを色の強度で表現するグラフです。
数値の大小関係を色の濃淡で示すことで、データの傾向を視覚的に把握できます。
例えば、気温データを表現する場合、赤色が高温を、青色が低温を示すといった具合です。
このような表現方法により、複雑なデータでも一目で全体像を把握できるようになります。

ヒートマップの利用シーン

ヒートマップは、さまざまな分野で活用されています。
データサイエンスの現場では、相関分析や時系列データの可視化によく使用されます。
具体的な利用例をいくつか紹介します。

ヒートマップの特徴と利点

ヒートマップは、データ可視化において独自の強みを持っています。
複雑なデータを直感的に理解できる点が最大の特徴です。
以下のような利点があります。

Matplotlibでヒートマップを作成するための準備

Matplotlibでヒートマップを作成する前に、必要な環境を整える必要があります。
適切な準備をすることで、スムーズにヒートマップの作成に取り掛かれます。

必要なライブラリのインストール

Matplotlibとその関連ライブラリをインストールします。
以下のコマンドをターミナルで実行してください。

pip install matplotlib numpy pandas seaborn

これらのライブラリは、ヒートマップ作成に必要不可欠なツールです。

基本的なインポート文

Pythonスクリプトの冒頭に、必要なライブラリをインポートします。
以下のコードを記述してください。

import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import pandas as pd

これらのライブラリを組み合わせることで、効果的なヒートマップを作成できます。

サンプルデータの準備

ヒートマップを作成するためのサンプルデータを用意します。
NumPyを使用して、簡単なデータを生成してみましょう。

# サンプルデータの生成
data = np.random.rand(10, 10)

このデータを使用して、基本的なヒートマップを作成していきます。

基本的なヒートマップの作成方法

Matplotlibを使用して、シンプルなヒートマップを作成する方法を解説します。
基本的な作成手順を理解することで、より複雑なヒートマップも作成できるようになります。

基本的なヒートマップの作成

最もシンプルなヒートマップは、以下のコードで作成できます。

# データの準備
data = np.random.rand(10, 10)

# ヒートマップの作成
plt.figure(figsize=(8, 6))
plt.imshow(data)
plt.colorbar()
plt.show()

このコードで、基本的なヒートマップが表示されます。

プロットの表示方法

ヒートマップの表示方法をカスタマイズできます。
以下のコードでは、異なるカラーマップを使用します。

plt.figure(figsize=(8, 6))
plt.imshow(data, cmap='viridis')
plt.colorbar(label='値')
plt.title('基本的なヒートマップ')
plt.show()

様々なカラーマップを試すことで、データの特徴をより効果的に表現できます。

軸ラベルの設定

軸ラベルを追加することで、ヒートマップの情報をより明確に伝えることができます。

plt.figure(figsize=(8, 6))
plt.imshow(data)
plt.colorbar()
plt.xlabel('X軸ラベル')
plt.ylabel('Y軸ラベル')
plt.title('ラベル付きヒートマップ')
plt.show()

ヒートマップのカスタマイズ

ヒートマップの見た目をカスタマイズすることで、より効果的なデータ可視化が可能です。
デザインの調整により、データの特徴をより明確に表現できます。

カラーマップの選択と調整

Matplotlibには、多様なカラーマップが用意されています。

# 異なるカラーマップの使用
plt.figure(figsize=(8, 6))
plt.imshow(data, cmap='hot')
plt.colorbar()
plt.title('異なるカラーマップを使用したヒートマップ')
plt.show()

代表的なカラーマップには以下のようなものがあります。

アノテーションの追加

セルに数値を表示することで、より詳細な情報を提供できます。

plt.figure(figsize=(10, 8))
plt.imshow(data, cmap='YlOrRd')
for i in range(len(data)):
    for j in range(len(data[0])):
        plt.text(j, i, f'{data[i, j]:.2f}',
                ha='center', va='center')
plt.colorbar()
plt.show()

グリッド線の設定

グリッド線を追加することで、セルの境界を明確にできます。

plt.figure(figsize=(10, 8))
ax = plt.gca()
plt.imshow(data)
ax.set_xticks(np.arange(-.5, len(data), 1), minor=True)
ax.set_yticks(np.arange(-.5, len(data), 1), minor=True)
ax.grid(which="minor", color="w", linestyle='-', linewidth=2)
plt.colorbar()
plt.show()

実践的なヒートマップの作成例

実際のデータを使用して、より実践的なヒートマップを作成します。
具体的なユースケースを通じて、ヒートマップの活用方法を学びます。

相関行列の可視化

データセット間の相関関係を視覚化します。

# サンプルデータの作成
df = pd.DataFrame(np.random.randn(10, 5),
                 columns=['A', 'B', 'C', 'D', 'E'])
correlation = df.corr()

# 相関行列のヒートマップ
plt.figure(figsize=(10, 8))
sns.heatmap(correlation, annot=True, cmap='coolwarm',
            vmin=-1, vmax=1, center=0)
plt.title('相関行列のヒートマップ')
plt.show()

時系列データの可視化

時間経過に伴うデータの変化を表現します。

# 時系列データの生成
dates = pd.date_range('2024-01-01', periods=10)
times = ['9:00', '12:00', '15:00', '18:00']
data = np.random.rand(len(dates), len(times))

# ヒートマップの作成
plt.figure(figsize=(12, 8))
sns.heatmap(data, xticklabels=times, yticklabels=dates,
            cmap='YlOrRd', annot=True)
plt.title('時間帯別データのヒートマップ')
plt.xlabel('時間帯')
plt.ylabel('日付')
plt.show()

地理データの可視化

地理的なデータを効果的に表現します。

# 地理データのシミュレーション
lat_points = np.linspace(35.6, 35.7, 10)
lon_points = np.linspace(139.7, 139.8, 10)
geo_data = np.random.rand(len(lat_points), len(lon_points))

# ヒートマップの作成
plt.figure(figsize=(10, 8))
plt.imshow(geo_data, extent=[139.7, 139.8, 35.6, 35.7],
           aspect='auto', cmap='terrain')
plt.colorbar(label='値')
plt.title('地理データのヒートマップ')
plt.xlabel('経度')
plt.ylabel('緯度')
plt.show()

まとめ

当記事では、Matplotlibを使用したヒートマップの作成について学習してきました。

ヒートマップは、データ可視化の強力なツールです。
ここで学んだ知識を活かして、自分のデータ分析に役立ててください。
さらに理解を深めるため、実際のデータで試してみることをおすすめします。

モバイルバージョンを終了