【Python】メモリを開放する方法全5選｜すべて実例付きで解説

（最終更新日：2023年7月）

✔当記事は以下のような方に向けて書かれています

「Pythonでのメモリ解放についてもっと知りたい」
「Pythonでメモリ解放を実現する方法は何だろう？」
「Pythonでメモリ解放を実行する具体的な例を参考にしたい」

✔当記事で学べる内容

Pythonでのメモリ解放の基本概念
Pythonでのメモリ解放の実装方法と応用事例
Pythonでメモリ解放を行う具体的な例

当記事では、Pythonでのメモリ解放の基本から応用に至るまで、具体例を交えながらわかりやすく解説します。

ぜひ最後までご覧ください。

運営者プロフィール

現在はIT企業のプロダクトマネージャーとして、個人向け/社内向けシステムなど、複数のシステム開発・運営に携わっています。

Webサイト構築やECサイトの開発経験に加えて、PythonなどのプログラミングやSalesforceなどのクラウドアプリケーションに関する幅広い知識・経験を活かして「プログラミング初心者がスムーズに学べるサイト」を目指しています。

Githubでは、趣味で作成したアプリなどを公開しています。

https://github.com/Yulikepython/

✔人に見せても恥ずかしくないコードを書こう

「リーダブルコード」は、わかりやすく良いコードの定義を教えてくれる本です。

見るからにきれいなコードの書き方
コードの分割方法
変数や関数の命名規則

エンジニアのスタンダートとすべき基準を一から解説しています。

何回も読むのに値する本なので、ぜひ手にとって読んでみてください。

リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック

created by Rinker

メモリに関する基礎知識

こちらでは、コンピュータのメモリについての基本的な知識をお伝えしていきます。

メモリの役割
ガーベジコレクションの仕組み
メモリリークとその原因

メモリの役割

メモリの役割は、コンピュータがデータを格納し、プログラムの実行に必要な情報を保持すること。

以下にメモリの主な役割を説明します。

データの保存: メモリはプログラムやデータを格納するための領域です。コンピュータはメモリを使用して、アプリケーションやファイルのデータを読み書きします。メモリは高速なアクセスが可能であり、コンピュータがデータに素早くアクセスできるようにします。
プログラムの実行: メモリは実行中のプログラムのコードや関数、変数、スタックフレームなどの情報を保持します。プログラムはメモリ内にロードされ、コンピュータのプロセッサがそれを実行します。メモリはプログラムの実行に必要なデータと命令を提供し、プログラムのフロー制御を管理します。
データの共有: メモリは複数のプログラムやプロセスがデータを共有するための共有メモリ領域を提供します。これにより、データの共有や相互作用が可能になり、異なるプログラム間でのデータの受け渡しや通信が行われます。
メモリ管理: メモリはコンピュータのリソースとして管理されます。オペレーティングシステムはメモリを管理し、必要なメモリ領域を割り当て、解放します。メモリ管理は、プログラムの実行中に必要なメモリ領域を最適化し、効率的に使用することを目的としています。

メモリはコンピュータの重要な要素であり、プログラムの実行やデータ処理において欠かせない役割を果たしています。

効率的なメモリ管理は、システムのパフォーマンスや安定性に直接影響を与えるため、重要な課題となります。

ガーベジコレクションの仕組み

ガーベジコレクションは、プログラムが動的に確保したメモリ領域のうち、不要になったものを自動的に解放するプロセスです。

Pythonでは、参照カウンティングという手法とともに、ガーベジコレクションが使われています。

これにより、メモリ上に残っているが使用されていないオブジェクトを自動的に削除し、メモリの使用効率を向上させます。

メモリリークとその原因

メモリリークは、プログラムがメモリを消費し続けることで、時間とともに利用可能なメモリが減少する現象です。

これはしばしば、プログラムがメモリを適切に解放しないために発生します。

例えばPythonでは、循環参照などがメモリリークの一因です。

メモリリークが進行すると、プログラムのパフォーマンスが低下し、最終的にはクラッシュする可能性があります。

Pythonにおけるメモリ解放の方法

こちらでは、Pythonでメモリを解放する方法についてお伝えします。

オブジェクトの削除: del文を使う
ガーベジコレクタの活用: gc.collectの使用

オブジェクトの削除: del文を使う

Pythonでは、del文を使用して、特定のオブジェクトをメモリから削除できます。

これは、特に大きなデータ構造を使用していてメモリが圧迫される場合に有用です。

例えば、以下のようにリストを削除します。

large_list = list(range(1000000))  # 大量のメモリを消費するリスト
del large_list  # メモリを解放

del文は変数だけでなく、リストの要素やスライスも削除することができます。

my_list = [1, 2, 3, 4, 5]
del my_list[1:4]  # インデックス1から3までの要素を削除
print(my_list)  # 出力: [1, 5]

ガーベジコレクタの活用: gc.collectの使用

Pythonには、ガーベジコレクションを制御するためのgcモジュールが含まれています。

通常、ガーベジコレクションは自動的におこなわれますが、gc.collect()を使用して手動でガーベジコレクションを強制することも可能です。

メモリの使用量を抑えつつ、特定のタイミングでリソースを解放する場合に役立ちます。

import gc

# 何らかのメモリ集約的な処理...

# ガーベジコレクションを強制的に実行してメモリを解放
gc.collect()

メモリを効率的に管理するテクニック

こちらでは、Pythonでメモリを効率的に管理するためのテクニックについてお伝えします。

ジェネレータの利用: yieldを使う方法
データ処理の最適化: pandasのchunksize指定
分散コンピューティングライブラリ: daskの使用

ジェネレータの利用: yieldを使う方法

ジェネレータは、メモリを節約しながら大量のデータを処理するのに非常に役立ちます。

通常の関数は一度にすべての結果をリストとして返すのに対して、ジェネレータは一度に1つの結果だけを返し、必要に応じて次の結果を計算するもの。

ジェネレータは、 yield ステートメントを使用して実現されます。

例えば、巨大な数列を生成するジェネレータを見てみましょう。

def large_number_sequence(max):
    num = 1
    while num <= max:
        yield num
        num += 1

# ジェネレータを使って数列を一つずつ処理する
for number in large_number_sequence(1000000):
    # ここで各数字を処理
    pass

一度に1000000個の数をメモリに格納する代わりに、一度に1つずつ処理しているため、メモリの使用量が大幅に削減されます。

データ処理の最適化: pandasのchunksize指定

pandasはデータ分析で頻繁に使用されるライブラリですが、大量のデータを扱う場合、メモリの使用量が問題になることがあります。

これを解決するために、pandasにはchunksizeパラメータを使いましょう。

このパラメータを使用すると、データを小さな塊（chunks）で読み込めます。

import pandas as pd

chunk_iter = pd.read_csv('large_dataset.csv', chunksize=1000)

for chunk in chunk_iter:
    # ここで各チャンクを処理
    process(chunk)

large_dataset.csvを1000行ずつ読み込んで処理します。

一度に全データをメモリに読み込むことなく、大量のデータを効率的に処理できるのです。

分散コンピューティングライブラリ: daskの使用

Daskは、大規模なデータセットに対して、効率的な並列処理をおこなえるPythonライブラリです。

データを小さなチャンクに分割し、これらのチャンクを並列に処理することで、メモリ内に収まらない大きなデータセットも扱えます。

非常に大きな配列に対して演算をおこなう場合の使用例を見てみましょう。

import dask.array as da

# Daskで大きな配列を作成（実際のデータはメモリにロードされていない）
x = da.random.random((10000, 10000), chunks=(1000, 1000))

# 配列の平均値を計算
mean = x.mean().compute()

print(mean)

上のコードは以下のような処理をおこなっています。