サイトアイコン ITC Media

【便利】PythonのShapeとは?具体例を使って徹底解説

(最終更新日:2023年7月)

✔当記事は以下の疑問を持つ方に向けて書かれています

「Pythonでshapeとは何を意味するのか?」
「Pythonでshapeをどのように使用するのか?」
「Pythonでshapeを使った実際のコードが見たい」

✔当記事を通じて獲得できる知識

当記事では、Pythonのshapeの基本からその具体的な活用方法までを、実際のコード例を交えて詳細に解説します。

ぜひ最後までご覧ください。

筆者プロフィール

【現職】プロダクトマネージャー

【副業】ブログ(月間20万PV)/YouTube/Web・アプリ制作

「プログラミング × ライティング × 営業」の経験を活かし、30後半からのIT系職へシフト。現在はプロダクトマネージャーとして、さまざまな関係者の間に入り奮闘してます。当サイトでは、実際に手を動かせるWebアプリの開発を通じて、プログラミングはもちろん、IT職に必要な情報を提供していきます。

【当ブログで紹介しているサイト】

当サイトチュートリアルで作成したデモ版日報アプリ

Django × Reactで開発したツール系Webアプリ

✔人に見せても恥ずかしくないコードを書こう

「リーダブルコード」は、わかりやすく良いコードの定義を教えてくれる本です。

  • 見るからにきれいなコードの書き方
  • コードの分割方法
  • 変数や関数の命名規則

エンジニアのスタンダートとすべき基準を一から解説しています。

何回も読むのに値する本なので、ぜひ手にとって読んでみてください。

PythonのShapeを理解するための前提知識

こちらでは、PythonのShapeを理解するための前提知識を見ていきましょう。

タプル表記の理解とその重要性

Pythonのnumpyライブラリでは、配列の形状を表すためにタプルという形式を用います

例を挙げると、(3,)という表記は、要素数3の1次元配列を意味する、などです。

(3,1)は3行1列の2次元配列を指します。

このようにタプル表記は、配列の次元数や各次元の要素数を一目で理解するための重要な道具といえるでしょう。

AIとPython中心のシェイプの活用

AI(人工知能)技術の中でも、深層学習は多次元配列を頻繁に用いるため、Shapeの理解は必須です。

画像データの処理を例とすると、以下の3つが3次元配列として扱われます。

それぞれの次元が何を表しているかを理解するためにはShapeの理解が不可欠です。

PythonにおけるShapeの全貌

こちらでは、PythonにおけるShapeの全貌について、詳しく解説します。

PythonとnumpyのShapeの基本

Pythonのnumpyライブラリでは、ndarrayオブジェクトのshape属性を使用して、配列の形状を取得したり変更したりが可能です。

Shapeは配列の各次元の大きさをタプルとして返します。

import numpy as np

# 1次元配列を作成
a = np.array([1, 2, 3, 4, 5])

# 形状を出力
print(a.shape)  # (5,) #1次元配列を意味する

# 2次元配列を作成
b = np.array([[1, 2, 3], [4, 5, 6]])

# 形状を出力
print(b.shape)  # (2, 3) #2次元配列を意味する

Shapeのプロパティとメソッド

shapeはnumpy配列のプロパティであり、その配列がどのような形状を持っているかを示します

またこのshapeプロパティを変更することで、配列の形状を変更可能です。

import numpy as np

# 1次元配列を作成
arr = np.array([1, 2, 3, 4, 5, 6])

# 配列の形状を出力
print("元の形状:", arr.shape)

# 形状を(3, 2)に変更
arr_reshaped = arr.reshape(3, 2)

# 変更後の形状と内容を出力
print("変更後の形状:", arr_reshaped.shape)
print("変更後の内容:")
print(arr_reshaped)

しかし、この時元の配列の要素数と変更後の要素数が一致する必要があります。

例えば、要素数が6つの1次元配列のshapeを(3, 2)に変更することは可能ですが、(4, 2)など要素数が一致しない形状には変更できません。

多次元配列とShape

numpyでは、1次元配列だけでなく、2次元配列や3次元配列など、任意の次元数の配列を扱えます。

これら多次元配列の形状も、shapeで取得できるのです。

例えば3次元配列の場合、shapeは(深さ, 行, 列)のように3つの数値から成るタプルとなります。

import numpy as np

# 3次元配列を作成
arr_3d = np.array([
    [[1, 2], [3, 4]],
    [[5, 6], [7, 8]],
    [[9, 10], [11, 12]]
])

# 配列の形状を出力
shape_3d = arr_3d.shape
print("3次元配列の形状:", shape_3d)

# 深さ、行、列を取得
depth, rows, cols = shape_3d
print("深さ:", depth)
print("行:", rows)
print("列:", cols)

Shapeの重要性と使い道

Shapeは配列の形状を把握し、形状に基づいた操作を行うための重要な道具です。

例えば行列計算では形状が一致していないと計算ができない場合があります。

import numpy as np

# 2つの行列を作成
matrix_a = np.array([[1, 2], [3, 4]])
matrix_b = np.array([[5, 6], [7, 8]])

# 行列の形状を確認
shape_a = matrix_a.shape
shape_b = matrix_b.shape

# 行列の形状が一致しているかを確認してから行列の加算を行う
if shape_a == shape_b:
    result = matrix_a + matrix_b
    print("行列の加算結果:")
    print(result)
else:
    print("行列の形状が一致していません。")

また画像処理では、画像の幅や高さ、色の次元数などを把握するためにshapeを使用します。

import cv2

# 画像を読み込む
image = cv2.imread("image.jpg")

# 画像の形状を確認
height, width, channels = image.shape

print("画像の幅:", width)
print("画像の高さ:", height)
print("画像の色の次元数:", channels)

さらに、ディープラーニングでは、テンソルと呼ばれる多次元配列を扱うため、shapeの理解は必須となっています。

Python Shapeの実践的解説

次に、PythonでShapeを実践で使う方法を解説します。

実践例を見ていきながら、手を動かして学びましょう。

行と列の次元数確認方法

numpy配列のshape属性を用いると、配列の行数と列数を一度に確認できます。

例えば、aという2次元配列がある場合、a.shapeを実行すると、(行数, 列数)の形で結果が得られるのです。

import numpy as np

# 2次元のnumpy配列を作成
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 配列の形状を確認
shape = a.shape

# 行数と列数を取得
rows, cols = shape

print("配列の形状:", shape)
print("行数:", rows)
print("列数:", cols)

特定次元の数をチェックする方法

配列の特定の次元の要素数だけを知りたい場合、インデックスを用いて取得できます。

例えば、aという2次元配列の行数だけを知りたい場合、a.shape[0]を実行します。

shapeはタプルです。

通常のタプルのインデックスと同様にして各次元の要素数を取得可能になります。

import numpy as np

# 2次元のnumpy配列を作成
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 配列の形状を確認
shape = a.shape

# 行数と列数を取得
rows = shape[0]
cols = shape[1]

print("配列の形状:", shape)
print("行数:", rows)
print("列数:", cols)

Python Shapeの一般的エラーとその対処法

ここでは、「Python Shapeの一般的エラーとその対処法」について詳しく解説します。

以下の3つのエラーとその対処法について見ていきましょう。

不適切な形状操作によるエラーとその修正

PythonのNumpyで、配列の形状を変更しようとした時、元の配列の要素数と変更後の形状の要素数が一致しなければならないというルールがあります。

例えば要素数が6つの配列を(2,4)のように変更しようとすると、エラーが発生します。

これは(2,4)の形状の配列には8つの要素が必要だからです。

このエラーを修正するためには、元の要素数と変更後の要素数が一致するよう、形状を変更してください。

形状不一致によるエラーとその解決方法

配列同士の演算を行う際には、形状が一致している必要があります。

一致しない場合、エラーが発生してしまうからです。

例えば、形状が(2,3)の配列と形状が(2,4)の配列の加算をおこなおうとするとエラーが発生します。

このエラーを解決するためには、操作する配列同士の形状を一致させましょう。

配列の次元に関するエラーとその回避方法

配列の次元数は、その形状(shape)の長さで決まります。

次元数が異なる配列同士の演算を行うとエラーが発生します。

この問題を回避するには、操作する配列同士の次元を一致させる、または一方の配列の次元を増やす(または減らす)などして対応しましょう。

Python Shapeの応用方法とテクニック

次に、「Python Shapeの応用方法とテクニック」について説明します。

PythonのShapeを用いることで、より複雑なデータ操作が可能になるでしょう。

多次元配列の形状変更によるデータ操作

Shapeの機能で、多次元配列の形状を変更すれば、データ操作を柔軟におこなえるでしょう。

例えば、3次元の画像データを1次元に変換することで、画像をベクトルとして扱い、データ分析が容易になります。

import numpy as np

# 3次元の画像データを作成(仮想的なデータ)
image_data = np.array([
    [[1, 2], [3, 4]],
    [[5, 6], [7, 8]],
    [[9, 10], [11, 12]]
])

# 画像データの形状を確認
print("元の形状:", image_data.shape)

# 3次元画像データを1次元に変換
flattened_data = image_data.ravel()

# 変換後の形状を確認
print("変換後の形状:", flattened_data.shape)

print("変換後のデータ:")
print(flattened_data)

ブロードキャストとShapeの関係

ブロードキャストは、Numpyにおいて形状の異なる配列間で演算を可能にする強力な機能です。

Shapeが一致しない配列同士でも、一定のルールに従うことで、Shapeを自動的に調整して演算をおこないます。

複雑な数値演算も簡単に実現可能です。

import numpy as np

# 形状が異なる2つの配列を作成
array1 = np.array([1, 2, 3])        # 形状: (3,)
array2 = np.array([[10], [20], [30]])  # 形状: (3, 1)

# ブロードキャストを使って配列同士を演算
result = array1 + array2

# 演算結果を表示
print(result)

Shapeを用いた高速な数値演算

Numpyの配列は、Pythonのリストと比較して高速な計算が可能。

なぜならNumpyがC言語で実装されているため、並列化されたハードウェアを効率的に利用できるからです。

さらに、Shapeを適切に操作することで、更なる高速化を達成することが可能です。

まとめ

当記事の内容をまとめます。

Shapeの理解と操作は、データ分析のための重要なスキルでもあります。

例えば、多次元のデータを1次元に変換し、機械学習モデルの入力として用いることが可能です。

Shapeの操作により、画像や音声などの複雑なデータ形式も効率的に扱えるでしょう。

ぜひ当記事をきっかけに、よりたくさんのコードを書いて、Shapeを含めたコーディングを覚えていってください。

モバイルバージョンを終了